机器人与人工智能爱好者论坛

标题: 深度学习笔记7:Tensorflow入门 [打印本页]

作者: Game    时间: 2018-8-19 21:17
标题: 深度学习笔记7:Tensorflow入门
      从前面的学习笔记中,和大家一起使用了  numpy  一步一步从感知机开始到两层网络以及最后实现了深度神经网络的算法搭建。而后我们又讨论了改善深度神经网络的基本方法,包括神经网络的正则化、参数优化和调参等问题。这一切工作我们都是基于numpy 完成的,没有调用任何深度学习框架。在学习深度学习的时候,一开始不让大家直接上手框架可谓良苦用心,旨在让大家能够跟笔者一样,一步一步通过 numpy 搭建神经网络的过程就是要让你能够更加深入的理解神经网络的架构、基本原理和工作机制,而不是黑箱以视之。
      但学习到这个阶段,你已充分理解了神经网络的工作机制,马上就要接触更深层次的卷积神经网络(CNN)和递归神经网络(RNN),依靠纯手工去搭建这些复杂的神经网络恐怕并不现实。这时候就该深度学习框架出场了。针对深度学习,目前有很多优秀的学习框架,比如说马上要讲的 Tensorflow,微软的 CNTK,伯克利视觉中心开发的 caffe,以及别具一格的 PyTorch 和友好易用的 keras,本系列深度学习笔记打算从 Tensorflow 开始,对三大主流易用的深度学习框架 Tensorflow、PyTorch 和 keras 进行学习和讲解。选择这三个框架的原因在于其简单易用、方便编程和运行速度相对较快。
      作为谷歌的深度学习框架, Tensorflow  在深度学习领域可谓风头无二。其中 Tensor 可以理解为类似于 numpy 的 N 维数组,名为张量; flow 则意味着 N 维数组的流计算,而 Tensor 的数据流计算形式则为一个计算图的形式进行计算。这里重点提一下,如果大学本科期间的线性代数忘记了的话,我劝你赶紧回去翻一翻,线性代数和矩阵论是深度学习的基础,希望你能熟练掌握。


      先看个简单的例子。
  1. import tensorflow as tf# Define y_hat constant. Set to 36.y_hat = tf.constant(36, name='y_hat')
  2. # Define y. Set to 39           y = tf.constant(39, name='y')                    # Create a variable for the lossloss = tf.Variable((y - y_hat)**2, name='loss')   # When init is run later (session.run(init)), the loss variable will be initialized and ready to be computedinit = tf.global_variables_initializer()        # Create a session and print the outputwith tf.Session() as session:  
  3.     # Initializes the variables                  
  4.     session.run(init)  
  5.     # Prints the loss                        
  6.     print(session.run(loss))
复制代码

6
      相信你已经大致明白了基于张量运算的 Tensorflow 的底层运行机制了。总结而言就是:创建张量、初始化张量、创建会话并执行。
      下面展示几个 Tensorflow 的神经网络计算的基础函数示例。

线性函数
  1. def linear_function():   
  2.     """
  3.     Implements a linear function:
  4.             Initializes W to be a random tensor of shape (4,3)
  5.             Initializes X to be a random tensor of shape (3,1)
  6.             Initializes b to be a random tensor of shape (4,1)
  7.     Returns:
  8.     result -- runs the session for Y = WX + b
  9.     """

  10.     np.random.seed(1)


  11.     X = tf.constant(np.random.randn(3,1), name='X')
  12.     W = tf.constant(np.random.randn(4,3), name='W')
  13.     b = tf.constant(np.random.randn(4,1), name='b')
  14.     Y = tf.add(tf.matmul(W, X), b)    # Create the session using tf.Session() and run it with sess.run(...) on the variable you want to calculate

  15.     init = tf.global_variables_initializer()
  16.     sess = tf.Session()
  17.     sess.run(init)
  18.     result = sess.run(Y)    # close the session
  19.     sess.close()   
  20.     return result
复制代码

计算sigmoid函数
  1. def sigmoid(z):   
  2.     """
  3.     Computes the sigmoid of z

  4.     Arguments:
  5.     z -- input value, scalar or vector

  6.     Returns:
  7.     results -- the sigmoid of z
  8.     """

  9.     x = tf.placeholder(tf.float32, name='x')
  10.     sigmoid = tf.sigmoid(x)   
  11.     with tf.Session() as sess:
  12.         result = sess.run(sigmoid, feed_dict={x: z})   
  13.     return result
复制代码

计算损失函数
  1. def cost(logits, labels):   
  2.     """
  3.     Computes the cost using the sigmoid cross entropy

  4.     Arguments:
  5.     logits -- vector containing z, output of the last linear unit (before the final sigmoid activation)
  6.     labels -- vector of labels y (1 or 0)

  7.     Note: What we've been calling "z" and "y" in this class are respectively called "logits" and "labels"
  8.     in the TensorFlow documentation. So logits will feed into z, and labels into y.

  9.     Returns:
  10.     cost -- runs the session of the cost (formula (2))
  11.     """

  12.     # Create the placeholders for "logits" (z) and "labels" (y) (approx. 2 lines)
  13.     z = tf.placeholder(tf.float32, name='z')
  14.     y = tf.placeholder(tf.float32, name='y')    # Use the loss function (approx. 1 line)
  15.     cost = tf.nn.sigmoid_cross_entropy_with_logits(logits=z, labels=y)    # Create a session (approx. 1 line). See method 1 above.
  16.     sess = tf.Session()    # Run the session (approx. 1 line).
  17.     sess.run(cost, feed_dict={z: logits, y: labels})    # Close the session (approx. 1 line). See method 1 above.
  18.     sess.close()   
  19.     return cost
复制代码

one hot 编码
  1. def one_hot_matrix(labels, C):   
  2.     """
  3.     Creates a matrix where the i-th row corresponds to the ith class number and the jth column
  4.                      corresponds to the jth training example. So if example j had a label i. Then entry (i,j)
  5.                      will be 1.

  6.     Arguments:
  7.     labels -- vector containing the labels
  8.     C -- number of classes, the depth of the one hot dimension

  9.     Returns:
  10.     one_hot -- one hot matrix
  11.     """
  12.     # Create a tf.constant equal to C (depth), name it 'C'. (approx. 1 line)
  13.     C = tf.constant(C)    # Use tf.one_hot, be careful with the axis (approx. 1 line)
  14.     one_hot_matrix = tf.one_hot(labels, C, axis=0)    # Create the session (approx. 1 line)
  15.     sess = tf.Session()
  16.     one_hot = sess.run(one_hot_matrix)    # Close the session (approx. 1 line). See method 1 above.
  17.     sess.close()   
  18.     return one_hot
复制代码

参数初始化
  1. def ones(shape):    """
  2.     Creates an array of ones of dimension shape
  3.     Arguments:
  4.     shape -- shape of the array you want to create

  5.     Returns:
  6.     ones -- array containing only ones
  7.     """
  8.     # Create "ones" tensor using tf.ones(...). (approx. 1 line)
  9.     ones = tf.ones(shape)    # Create the session (approx. 1 line)
  10.     sess = tf.Session()    # Run the session to compute 'ones' (approx. 1 line)
  11.     ones = sess.run(ones)    # Close the session (approx. 1 line). See method 1 above.
  12.     sess.close()   
  13.     return ones
复制代码

    一顿操作之后,我们已经将神经网络的一些基础运算利用 Tensorflow 定义好了。在下一期笔记中,我们将学习如何使用 Tensorflow 搭建神经网络。
本文来自《自兴动脑人工智能》项目部:凯文


作者: morinson    时间: 2018-11-17 13:58
非常赞




欢迎光临 机器人与人工智能爱好者论坛 (http://www.robot-ai.org/) Powered by Discuz! X3.2