tensorflow-serving

XiNGRZ 发布于2023-04-25 20:22 / 3162人阅读

TensorFlow Serving是一个开源的高性能机器学习模型部署框架，可用于将训练好的模型部署到生产环境中进行预测。TensorFlow Serving具有许多有用的功能，如模型版本控制、模型热更新、模型的灰度发布和模型可扩展性等，这些功能使得TensorFlow Serving成为生产环境中部署机器学习模型的理想选择。本文将介绍如何使用TensorFlow Serving进行模型部署。 1. 安装TensorFlow Serving 首先，您需要在您的计算机上安装TensorFlow Serving。您可以通过以下命令在Ubuntu上安装TensorFlow Serving：

</>复制代码 
$ echo "deb [arch=amd64] http://storage.googleapis.com/tensorflow-serving-apt stable tensorflow-model-server tensorflow-model-server-universal" | sudo tee /etc/apt/sources.list.d/tensorflow-serving.list && curl https://storage.googleapis.com/tensorflow-serving-apt/tensorflow-serving.release.pub.gpg | sudo apt-key add -
$ sudo apt-get update && sudo apt-get install tensorflow-model-server

2. 导出模型在将模型部署到TensorFlow Serving之前，您需要导出您的训练好的模型。您可以使用TensorFlow中的`tf.saved_model.builder.SavedModelBuilder` API将模型导出为`SavedModel`格式。

</>复制代码 
python
import tensorflow as tf
# 构建计算图
input_tensor = tf.placeholder(tf.float32, shape=[None, 784], name="input")
output_tensor = tf.placeholder(tf.float32, shape=[None, 10], name="output")
hidden = tf.layers.dense(input_tensor, 256, activation=tf.nn.relu)
logits = tf.layers.dense(hidden, 10, name="logits")
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=logits, labels=output_tensor))
train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss)
# 训练模型
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for i in range(1000):
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_op, feed_dict={input_tensor: batch_xs, output_tensor: batch_ys})
    
    # 导出模型
    builder = tf.saved_model.builder.SavedModelBuilder("model")
    builder.add_meta_graph_and_variables(sess, ["serve"])
    builder.save()

在这个例子中，我们创建了一个具有256个隐藏神经元的单层神经网络，并使用MNIST数据集训练了1000个epoch。我们使用`SavedModelBuilder`将模型导出到名为"model"的目录中。 3. 启动TensorFlow Serving 接下来，您需要启动TensorFlow Serving。您可以使用以下命令启动TensorFlow Serving：

</>复制代码 
$ tensorflow_model_server --port=9000 --model_name=my_model --model_base_path=/path/to/my_model

在这个例子中，我们将模型名称设置为"my_model"，并将模型的路径设置为"/path/to/my_model"，将TensorFlow Serving的端口设置为9000。 4. 发送预测现在，我们已经将模型部署到TensorFlow Serving中，并且可以使用客户端发送预测请求。在Python中，您可以使用`tensorflow`库的`gprc`模块来与TensorFlow Serving进行通信。您可以使用以下代码发送预测请求：

</>复制代码 
python
import tensorflow as tf
from tensorflow_serving.apis import predict_pb2
from tensorflow_serving.apis import prediction_service_pb2_grpc
# 创建gRPC stub
channel = grpc.insecure_channel("localhost:9000")
stub = prediction_service_pb2_grpc.PredictionServiceStub(channel)
# 创建请求
request = predict_pb2.PredictRequest()
request.model_spec.name = "my_model"
request.model_spec.signature_name = tf.saved_model.signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY
request.inputs["input"].CopyFrom(tf.contrib.util.make_tensor_proto(input_data, shape=[1, 784]))
# 发送请求
result = stub.Predict(request, 10.0) # 等待10秒钟的超时时间

在这个例子中，我们使用`grpc.insecure_channel`创建了一个与TensorFlow Serving通信的gRPC stub。我们创建了一个`PredictRequest`请求，并将其发送到TensorFlow Serving。我们还指定了一个等待10秒钟的超时时间，以确保请求能够成功地完成。在这个例子中，我们发送了一个大小为1x784的输入张量，并将其包含在`PredictRequest`请求中。我们还指定了`signature_name`为`tf.saved_model.signature_constants.DEFAULT_SERVING_SIGNATURE_DEF_KEY`，这表示我们使用默认的模型签名。 5. 总结在本文中，我们介绍了如何使用TensorFlow Serving将机器学习模型部署到生产环境中。我们首先介绍了如何导出训练好的模型，然后介绍了如何启动TensorFlow Serving。最后，我们介绍了如何使用Python客户端向TensorFlow Serving发送预测请求。 TensorFlow Serving提供了许多有用的功能，如模型版本控制、模型热更新和模型的灰度发布等，这使得TensorFlow Serving成为生产环境中部署机器学习模型的理想选择。

GPU云服务器云服务器

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/130762.html

使用Kubernetes和TensorFlow Serving将神经网络镜像分类进行弹性扩容

摘要：大会以机器学习资料中心和云端安全为主要议题，为未来发展做战略规划。在年，谷歌开发了一个内部深度学习基础设施叫做，这个设施允许谷歌人创建更大的神经网络和扩容实训成千上万个核心。导言 Google近日3月23－24日在美国旧金山举办首次谷歌云平台（Google Cloud Platform） GCP NEXT大会，参会人数超过2000人。GCP NEXT大会以机器学习、资料中心和云端安全...

Harpsichord1207 2019-07-01 16:20 评论0 收藏0
使用 TensorFlow Serving 和 Docker 快速部署机器学习服务

摘要：从实验到生产，简单快速部署机器学习模型一直是一个挑战。总结上面我们快速实践了使用和部署机器学习服务的过程，可以看到，提供了非常方便和高效的模型管理，配合，可以快速搭建起机器学习服务。从实验到生产，简单快速部署机器学习模型一直是一个挑战。这个过程要做的就是将训练好的模型对外提供预测服务。在生产中，这个过程需要可重现，隔离和安全。这里，我们使用基于Docker的TensorFlow Se...

endless_road 2019-06-28 17:05 评论0 收藏0

发表评论

登陆后可评论

0条评论

XiNGRZ

男|高级讲师

我要关注我要私信

TA的文章

tensorflow-serving

阅读 3163·2023-04-25 20:22
BFC(块级格式化上下文)的特点和应用场景

阅读 3432·2019-08-30 11:14
页面布局解决方案

阅读 2677·2019-08-29 13:03
前端面试--性能优化

阅读 3273·2019-08-26 13:47
发布订阅模式-实现公众号订阅/内容发布/取消订阅功能

阅读 3320·2019-08-26 10:22
JS动态解析浏览器和网页的各种宽高属性

阅读 1350·2019-08-23 18:26
看完这篇，你也可以实现一个360度全景插件

阅读 701·2019-08-23 17:16
区块链项目如何俘获用户芳心，这些用户心声你值得听一听

阅读 1989·2019-08-23 17:01

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

tensorflow-serving

</>复制代码

</>复制代码

</>复制代码

</>复制代码

相关文章

使用Kubernetes和TensorFlow Serving将神经网络镜像分类进行弹性扩容

使用 TensorFlow Serving 和 Docker 快速部署机器学习服务

发表评论

0条评论

XiNGRZ

男|高级讲师

TA的文章

tensorflow-serving

BFC(块级格式化上下文)的特点和应用场景

页面布局解决方案

前端面试--性能优化

发布订阅模式-实现公众号订阅/内容发布/取消订阅功能

JS动态解析浏览器和网页的各种宽高属性

看完这篇，你也可以实现一个360度全景插件

区块链项目如何俘获用户芳心，这些用户心声你值得听一听

最新活动