zl程序教程

您现在的位置是:首页 >  工具

当前栏目

MIT的《深度学习》精读(5)

学习 深度 MIT 精读
2023-09-14 09:10:42 时间

In the early days of artificial intelligence, the field rapidly tackled and solved problems that are intellectually difficult for human beings but relatively straightforward for computers—problems that can be described by a list of formal, mathematical rules. The true challenge to artificial intelligence proved to be solving the tasks that are easy for people to perform but hard for people to describe formally—problems that we solve intuitively, that feel automatic, like recognizing spoken words or faces in images. 

在人工智能(AI)的早期阶段,很快就解决了人们感觉到工作上很困难的问题和研究学习上感觉到很困难的问题,但是这些困难的问题对于计算机来说都是非常容易的事情,因为这些问题都可以使用一套公式列表和数学方法来表示出来。对于人工智能真正起到挑战的问题是这些人类感觉很简单的问题和任务,并且这些问题比较难以描述出来,人们凭感觉去做的事情,或者自动就能识别出来的东西,比如口头交流的自然语言或者人脸的图片。

 

在这段里,描述了计算机比较擅长的数学描述的问题,比如计算圆周率1000多位,但对于人来说,这是非常困难的。又比如做会计的工作,像以前银行算帐,需要很多人来计算,但目前只需要一台电脑,就可以顶数百个人的计算量了,比如神威太湖之光超级计算机运算一分钟相当地球全部人算32年,可见在计算一些数学上的问题,计算机感觉很威猛。

自从计算机问世以来,人类一直希望能让计算机理解和合成人类的自然语言,即人类的日常语言,这就是“自然语言理解”,机器翻译、人机对话、语音识别和语音合成、汉字的识别,都是自然语言理解关心的问题。其中最核心的目标是让计算机理解和合成自然语言,即教会计算机听话和说话。如果这一核心目标能够达到,人类将从人工翻译、计算机编程语言的学习等大量工作中解放出来,人类也将从计算机理解和合成自然语言的过程中观察到人类心智活动的机制。不少专家曾经估计,实现计算机理解和合成自然语言不会是一个遥远的路程。

  但是,当专家们着手展开研究的时候,发现自然语言的理解和合成机制比专家们最初设想的要困难得多,这种困难主要不在计算机方面,而在自然语言方面。计算机科学近几十年己经取得了重要进展,但自然语言理解的工作进展并不显著,原因就在于我们对自然语言的运转规律认识远远不够,我们平时司空见惯的言谈说话,实际上是一个相当复杂的心智活动过程。

人们最初想用马尔柯夫过程(Markov process)来理解和合成自然语言。马尔柯夫过程是一类重要的随机过程,其原始模型为马尔柯夫链,由俄国数学家马尔柯夫1907年提出的。马尔柯夫过程的基本思想是:一个事件在己知的目前(现在)状态下,它未来的演变(将来)不依赖于它以往的演变(过去)。

美国的结构语言学家已经提出了一套发现句子层次程序,这是在语法分析上的一个重要进展,也是自然语言理解的重要论理基础。自然语言中的层次问题本质上是一个词语组合的顺序问题,这和数学语言中的运算顺序是相当的,在数学中我们有:

3+2*5

数学家预先规定了先乘除后加减的顺序,实际上是规定了数学语言的层次。如果我们要先加再乘,就需要用括号:

 

(3+2)*5由于数学语言是人工语言,数学符号的运算顺序或组合层次是有标记的。“先乘除后加减”是规定好的隐性标记,加括号是显性标记。自然语言中词的运算顺序或组合层次就缺乏标记,因此在计算机中,自然语言词语组合层次的切分比数学公式的层次切分要困难得多。

  困难还不限于层次切分。在上面数学公式和自然语言句子中,按照层次切分出来的片断都是符合数学规则或有意义的片断,"3+2"是符合数学规则的,“英语班的学生”是有意义的片断。但是,自然语言中有些句子不完全是按照层次的原则组合的。比如:“将他的军”无论是“将他的”还是“他的军”,都是没有意义的片断,这说明这个句子的第一个层次是没法切分的。这也说明,光有层次分析还不能解释自然语言全部句子的组合机制,自然语言的语法规则比现有的任何人工语言都要复杂。二十世纪五十年代,美国语言学家乔姆斯基(N.Chomsky)在层次的基础上提出了转换规则,主张用层次和转换两种手续来说明自然语言的语法规则,乔姆斯基还把层次和转换形式化了,这就是著名的转换生成语法,这一理论是计算机编译原理的重要论理基础,也是自然语言理解一个重要进展,因为乔姆斯基的理论促使机器语言更接近自然语言的形式,导致高级编程语言的出现。

乔姆斯基的转换生成语法对自然语言的语法规则进行了形式化的描写,但在自然语言理解过程中,光有语法分析是不够的。自然语言理解所面临的另一难题是怎样解决语义问题。

可见人类几乎每天每时每刻都在使用的对话,在计算机的面前就成为了一个非常困难的问题。至于何时能解决,还需要看这轮人工智能的发展,你是否成为解决这个问题的第一人呢?


1. TensorFlow入门基本教程

2. C++标准模板库从入门到精通 

3.跟老菜鸟学C++

4. 跟老菜鸟学python

5. 在VC2015里学会使用tinyxml库

6. 在Windows下SVN的版本管理与实战 

 http://edu.csdn.net/course/detail/2579

7.Visual Studio 2015开发C++程序的基本使用 

http://edu.csdn.net/course/detail/2570

8.在VC2015里使用protobuf协议

9.在VC2015里学会使用MySQL数据库