作为TensorFlow的底层语言，你会用C++构建深度神经网络吗？

flyer_dev 发布于2019-04-25 18:22 / 2420人阅读

摘要：它们从文件中生成一个浮点型的二维数组，并用于馈送到神经网络。最后计算损失函数，即计算预测价格和实际价格之间的差异，并添加正则化到损失函数中。现在我们在有一系列节点，当在会话中使用时，每个节点计算损失函数对一个变量的梯度。

目前流行的深度学习框架 TensorFlow（TensorFlow 中文官方公众号已于月初发布）是以 C++为底层构建的，但绝大多数人都在 Python 上使用 TensorFlow 来开发自己的模型。随着 C++ API 的完善，直接使用 C++来搭建神经网络已经成为可能，本文将向你介绍一种简单的实现方法。

很多人都知道 TensorFlow 的核心是构建在 C++之上的，但是这种深度学习框架的大多数功能只在 Python API 上才方便使用。

当我写上一篇文章的时候，我的目标是仅使用 TensorFlow 中的 C++ API 和 CuDNN 来实现基本的深度神经网络（DNN）。在实践中，我意识到在这个过程中我们忽略了很多东西。

注意，使用外部操作（exotic operations）训练神经网络是不可能的，你面临的错误最有可能就是缺少梯度运算。目前我正在试图将 Python 上的梯度运算迁移到 C++上。

在本文中，我将展示如何使用 TensorFlow 在 C++ 上构建深度神经网络，并通过车龄、公里数和使用油品等条件为宝马 1 系汽车进行估价。目前，我们还没有可用的 C++ 优化器，所以你会看到训练代码看起来不那么吸引人，但是我们会在未来加入的。

本文章遵从 TensorFlow 1.4 C++ API 官方指南：https://www.tensorflow.org/api_guides/cc/guide

代码 GitHub：https://github.com/theflofly/dnn_tensorflow_cpp

安装

我们会在 C++ 中运行 TensorFlow 框架，我们需要尝试使用已编译的库，但肯定有些人会因为环境的特殊性而遇到麻烦。从头开始构建 TensorFlow 将避免这些问题，同时确保使用的是版本的 API。

首先，你需要安装 bazel 构建工具，这里有安装方法：https://docs.bazel.build/versions/master/install.html

在 OSX 上 brew 就足够了：

brew install bazel

你需要从 TensorFlow 源文件开始构建：

mkdir /path/tensorflow

cd /path/tensorflow

git clone https://github.com/tensorflow/tensorflow.git

随后你需要进行配置，如选择是否使用 GPU，你需要这样运行配置脚本：

cd /path/tensorflow

./configure

现在我们要创建接收 TensorFlow 模型代码的文件。请注意，第一次构建需要花费很长一段时间（10-15 分钟）。非核心的 C++ TF 代码在 /tensorflow/cc 中，这是我们创建模型文件的位置，我们也需要 BUILD 文件让 bazel 可以构建模型。

mkdir /path/tensorflow/model

cd /path/tensorflow/model

touch model.cc

touch BUILD

我们在 BUILD 文件中加入 bazel 指令：

load(

"//tensorflow:tensorflow.bzl"

"tf_cc_binary"

)

tf_cc_binary(

name =

"model"

srcs = [

"model.cc"

deps = [

"//tensorflow/cc:gradients"

"//tensorflow/cc:grad_ops"

"//tensorflow/cc:cc_ops"

"//tensorflow/cc:client_session"

"//tensorflow/core:tensorflow"

)

基本上，它会使用 model.cc 构建一个二进制文件。现在，我们可以开始编写自己的模型了。

读取数据

这些数据从法国网站 leboncoin.fr 上摘取，随后被清理和归一化，并被存储于 CSV 文件中。我们的目标是读取这些数据。经归一化的源数据被存储在 CSV 文件的第一行，我们需要使用它们重构神经网络输出的价格。所以，我们创建 data_set.h 和 data_set.cc 文件来保持代码清洁。它们从 CSV 文件中生成一个浮点型的二维数组，并用于馈送到神经网络。

data_set.h

using namespace std;