科技一站

 找回密码
 立即注册
查看: 151|回复: 2

趣谈人工智能的进展和挑战

[复制链接]

5

主题

6

帖子

16

积分

新手上路

Rank: 1

积分
16
发表于 2022-9-23 16:32:30 | 显示全部楼层 |阅读模式

日前,MoPaaS首席科学家洪涛博士,在“人工智能技术发展和挑战:人才、算力和工程的考虑“线上沙龙上做了《趣谈人工智能的进展和挑战》主题演讲,与各位参会老师和行业同仁分享了关于人工智能的进展和挑战,以下为本场分享的核心内容:

内容主要有三部组成:第一部分是简述人工智能的历史,符号主义占主导,联结主义逆袭;第二部分是过去十年的深度学习革命,学术界&工业界齐头并进;第三部分是人工智能的进展和挑战。
人工智能的简史:
人工智能(Artificial Intelligence)顾名思义就是让机器具有比拟人类的智能。而人类的智能,简单来说是:听、读、写、劳动、思考、推理和决策。在过去的六七十年时间里,人工智能从无到有,相应形成了一系列机器学习领域:包括机器视觉、语音识别、自然语言处理、机器人和机器学习等。
人工智能也不仅仅是一门科学技术,它也是人类超越自身认识智能的愿景梦想,所以人人关注。若有进步,大家就容易得意洋洋,以为大功告成,突破在即;若遇到挫折,也容易沮丧,以为凛冬来临,春天遥遥无期。而实际上,人工智能的发展道路的确是非常的曲折,领域起起伏伏,几经盛夏寒冬的轮回。从现在十多年深度学习革命带来的发展来看,人工智能无疑正处在繁荣期,前途仍很光明。
人工智能领域正式的诞生,要回溯到1956年夏天的Dartmouth会议,研讨会持续七八周。人工智能领域的诸多的开创者:如Marvin Minsky、 John McCarthy、Herbert Simon(司马贺)、 Allen Newell 、信息论的开创者— Claude Shannon 等等,都悉数到场。
人工智能如果把它看成一棵树的话,它有三条根,三个流派。最大的一条根是符号主义,其中又分以Minsky和McCarthy为代表的数理逻辑学派,和以司马贺等为代表的心理学派,从一开始就牢牢占据了主导的地位。另外两条根茎,一个是联结主义(也就是神经网络)和行为主义。这两个流派,从一开始就处于边缘地位,长期以来都受到符号主义的压制,直到最近的十年的深度学习的突破,他们的潜力爆发出来了,反客为主,成为人工智能的主流。



联结主义始于19世纪40年代,从控制论方面开始,50年代就有了简单的感知机,神经网络只有输入层和输出层,但是它出来以后有局限,只有线性分类之类的模式识别问题能被解决。为此,以人工智能教父自居的Minsky等写了本书,把感知机的局限性从理论上刻画了出来了。一下子不仅把感知机给一棒子打死,也给神经网络途径带上了紧箍咒;联结主义,被视为旁门左道;坚持神经网络的研究者,如同被打入冷宫。因为符号主义主流进展不如预期,实际上到了80年代,整个人工智能处于严冬的时候。
但是,八十年代,如星星之火,仍有人相信联结主义,继续坚持从事神经网络研究,并取得一个个可喜的进展。例如,感知机中加入了Hidden Layers,变成了多层神经网络,突破了感知机的能力局限;多层神经网络上,也因为发明了反向传播学习算法,又突破性的往前推进了一步,但仍限制在学术领域。最近的十几年,我们所说的深度学习,具有更多层的神经网络,它依靠的不仅仅是算力的支持,还有数据的支持,这也让它成功的从学术界走到工业界,形成了燎原之势。
过去十年的深度学习革命,学术界&工业界齐头并进


说到人工智能深度学习的革命,要从十年前的一场大拍卖讲起。2012年夏天,百度向深度学习的教父Geoffrey Hinton(杰弗里·辛顿)抛来橄榄枝,以一千多万美金的报酬盛情邀请他和学生来加盟百度,Hinton是一个纯粹的学者,百度的高薪邀请让他倍感知音,以为盛情难却,于是便口头就答应了要求。当Hinton回到多伦多和他自己的学生sutskever 、Krizhevsky说了这件事情,他的学生说:像谷歌、微软等很多的大公司对我们的研究进展其实也都很感兴趣,我们现在也算是奇货可居,是不是也应该货比三家,让关注我们研究的其他公司也来报价竞争;然后,我们再选择加盟哪家公司,更适合我们,更有利于推广深度学习成果,推进其进一步发展。Hinton采纳了俩学生的建议,并咨询了学校知识产权律师的意见后,成立了一家公司叫 DNNResearch(Deep Neural Network Research)的三人的公司。
那时神经网络每年都会在太浩湖边上开NIPS会议。2012年底的NIPS 在会议期间,Hinton举行了一场秘密拍卖,由对他们DNN感兴趣的公司来竞价来购买Hinton公司。当时,有4个公司参加了这次竞价,第一家是百度,余凯代表参加;第二家是谷歌,派出了工程主管 Alan Eustace(艾伦·尤斯塔斯),还有大名鼎鼎的Jeff Dean一起去;第三家是微软,由微软研究院的邓力教授来代表;最后一家是来自伦敦的初创公司叫DeepMind,它的创始人 Demis Hassabis(戴密斯·哈萨比斯)来参加。竞价从1200万开始,当然一开始,他们是有明确的规定,竞价必须是真金白银的竞价,有了这种限制,DeepMind就退出了竞争,因为它是一个创业公司,正在烧钱阶段,所能给出的只有股票期权,但实际上,DeepMind早已经邀请Hinton做公司的技术顾问。另外3家公司的竞价,从1200万到1500万,再到2200万美元时候,微软觉得物超所值就退出了竞价,这样,最后只剩谷歌和百度之间竞价。当价格竞争到了4400万的时候,Hinton叫停了拍卖,他认为双方已经展示了足够的诚意,DNNResearch对这个价格已经非常满意了,他要根据自己对哪个公司更感兴趣,感觉在哪个公司可以做出给领域带来更大的变化而做出决定,最后他们决定自己被谷歌收购。次年, 也就是2013年初, Hinton和学生就正式加盟谷歌。回头看历史,这场拍卖拉开了工业界深度革命的序幕。


Hinton的家世非常深厚,他的祖上George Boole,是我们计算机领域逻辑代数—布尔代数的发明人。他们家的其他先辈也非常具有冒险精神,其中一个 George Everest 最早探险去到青藏高原攀登珠穆拉玛峰;珠穆朗玛峰在西方叫Mount Everest,实际上是以他来命名的。另外他们家也屡出左派,参加革命;如他的一个姑奶奶叫伏尼契( Ethel Lilian Voynich),在年轻的时候写了一本讲意大利革命的小说叫:《牛虻》。《牛虻》苏联和新中国都是红色经典,还被拍成电影,广为流传。Hinton家族跟中国也很有关系,他的一个表姑姑叫寒春,当年是杨振宁的同学,在芝加哥费米实验室工作,参加过美国的曼哈顿计划;但是她是美国共产党,思想左倾;在二战结束以后,她对美国的核武政策失望,于是放弃了自己物理学的研究,跟她同样左倾的哥哥--韩丁一块儿到了中国解放区参加土改;后来她和韩丁的革命同学阳早结婚,俩人一起,一直在中国待了一辈子;他们来华的使命,就是把奶牛种牛引进了中国,养牛挤奶;她认为如果如果都能喝上牛奶,中国人的健康水平就能得以提升;名至实归,据说她获得了中国政府给外国人颁发的第一张绿卡。
Hinton本人本科在剑桥大学学习实验心理学,然后,71年到78年的时候,在爱丁堡大学读神经网络方面的博士,当时,正是人工智能的冬天,他的导师早已对神经网络失去兴趣,并劝他换课题,但是当时的Hinton初衷不改,执意要读这个方向。


Hinton在英国爱丁堡大学博士毕业了以后,挺难找博士后。很幸运,他远涉重洋在美国加州圣地亚哥 UCSD 找到了博士后工作,导师是David Rumelhart 。David Rumelhart当时正在主持一个神经网络研究叫PDP(Parallel  Distributed Processing)项目非常成功。这个项目是在UCSD的心理系,后来,以它为基础发展出了世界上第一个认知科学系。80年代中期PDP在学术研究上很成功,当PDP成功以后,PDP小组的成员各奔前程,自谋高就,Hinton就去CMU的计算机系去当助理教授了,没过几年就升为了副教授,但他不喜欢CMU计算机系以军工国防资助为主导的人工智能学术环境,于是就移师到多伦多大学执教。David Rumelhart 90年代初,也回到了自己的母校斯坦福大学,很不幸不久就发现得了脑癌,只好提前退休养病,他2011年去世。Rumelhart 的一个学生,在硅谷创业,致富以后,2000年的时候给认知科学学会捐款,并设立了David Rumelhart Prize奖金,每年奖励认知科学领域最有贡献的研究,众望所归,Hinton是这个奖金第一个获得者。


1986年Hinton在CMU当教授期间,举办一个神经网络暑期班。结束时,师生合影,留下这张非常有纪念意义的照片。基本上老师在前排蹲着,学生在后面站着。Hinton是蹲在前面的,这后面站着的学生,有现在伯克利机器学习的大拿Michael Jordan、来自法国的博士生Yann LeCun(Hinton后来也成为了他的博士答辩委员会的成员)、强化学习的鼻祖Andy Barto等等,这些人后来都成为机器学习/神经网络/强化学习/深度学习这些方面的骨干核心,真可谓:聚如一团火,散比满天星。经过了深度学习革命几年以后,整个学术界都承认了联结主义对机器学习和人工智能的巨大贡献,其标志就是:深度学习的3个巨头,Hinton,Yann LeCun和Yoshua Bengio 在2018年获得了图灵奖。


十几年前,深度学习的成功还只是在学术圈里,他们要想跨出这一步,让工业界接受其实是艰难的一步。因为,当时占主流的流派,看不起神经网络流派,也没有人去关注深度学习的进步,所以Hinton经常会受到一些羞辱,例如明斯基有一次在Hinton去MIT办讲座的时候就羞辱过他,当时明斯基坐在前排,听了几分钟以后就把打印出来拿在手里的Hinton的论文,往地下一扔,扬长而去。还有伯克利的教授Jitendra Malik等,是机器视觉方面的权威,在一次Hinton给学术报告时,直接打断,指责神经网络研究言过其实纯属吹牛,好在Hinton不为羞辱,锲而不舍,会后专门打电话给Malik,坦诚的问:你为什么会对我们有这样的偏见,有什么样的挑战我们能够解决了,能够让你信服我们深度学习是真正有用的工作?正好在2012年,Malik告诉他,现在有一个ImgeNet的挑战赛,你们要是参加,能够拿到好的名次,能够有好的成绩,那我就心服口服。Hinton带着他的两个学生参加了,他们在一起做了一个AlexNet,在ImgeNet挑战赛上面取得最好成绩, 可谓一战成名。就是这样,人工智能各个研究领域逐一见证深度学习的突破,使深度学习脱引而出,进入主流。当然这还仅仅是在学术界发生的可喜变化。


在工业界深度学习这把火烧起来是靠一些在硅谷的大学教授们,近水楼台先得月,因为他们首先在学术界感受到了深度学习的进步,也看到了广阔的应用潜力,就薪火相传,传递到工业界。吴恩达和 Sebastian Thrun 是斯坦福大学计算机系人工智能领域的教授,他们在2010年年底的时候,专门和谷歌的创始人Larry Page约喝茶。见面的时候,他们请Larry Page关注深度学习的进展,力促谷歌加强投入,开展研发。Larry Page接受了他们的建议,也邀请两位教授随即参加谷歌建立X Project,推动深度学习在谷歌落地开花。


在谷歌,要把研究推广到产品里,受到了很大的阻力,因为谷歌是以一个搜索引擎公司,最大的部门是搜索部门,搜索部门的老大Amit Singh是信息检索出身,他以对机器学习和深度学习这些并不感兴趣,所以他拒绝了跟他们合作。Jeff Dean是负责基础架构,并有很好的人望,他愿意跟吴恩达他们合作,一起把事情开始做起来了。但是一年以后,吴文达和 Sebastian Thrun 兴趣转移,分别辞职去创业做网课,他们走的时候郑重的推荐了深度学习的教父Hinton。


谷歌事实上是两条腿走路,他除了在内部让吴恩达、Jeff Dean推动内部的研发转型,另外,在外面也果断地收购了DeepMind。DeepMind于2010年9月份在伦敦成立,创始人Demis Hassabis 年纪轻轻却雄心勃勃,把公司定位成一家做超级人工智能的革命性技术公司。公司一成立就吸引了Elon Musk和Peter Thiel等知名投资企业家天使轮追捧投资。仅仅四年后,2014年谷歌以六亿五千万的价格把DeepMind收入囊中。


2015年到2017年,DeepMind选择第一个攻克的人工智能难题就是围棋。这3年里DeepMind真是完美解决了围棋问题,证明了像围棋这样的智能高地,人工智能系统完胜人类智能,碾压人类顶尖棋手。这不仅仅是算法的胜利,也是计算机算力的胜利。


谷歌的发展在硅谷是个领头羊,像Facebook也不甘示弱,马克扎克伯格也去参加NIPS会议,他跟Yann LeCun去沟通,然后盛情的邀请Yann LeCun从纽约大学加盟Facebook,成立Facebook的人工智能实验室。


微软则是由陆奇推动,邀请了 Yoshua bengio做微软的顾问,Yoshua Bengio的弟弟,很早就在硅谷的谷歌工作,最近又跳槽到苹果了。


人工智能深度学习领域,在过去十年人才的竞争到了白热化的地步。据2018年纽约时报的一篇报道,谷歌/Facebook/微软这些大的商业公司,盈利能力都很高,高薪抢那些人工智能的行家里手自然是可以理解;但是一些非营利公司,如当时刚成立的OpenAI竟然以每年200万美金的薪酬邀请Hinton的学生 Sutskever;对抗生成网络的发明人GoodFellow,半年也给了他80多万的薪酬;吴恩达的第一个博士生Pieter Abbeel在伯克利做教授,他在OpenAI做兼职也给了40多万的薪酬。人工智能领域以前没有发生过这样的事情,学术研究的人竟然能够拿到这么高的薪酬。有人解释说人工智能深度学习领域现在像极了体育界的篮球NBA和橄榄球NFL,大家都在争取明星加盟,给他们很好的年薪,给他们转会费,这样造成了明星的效应,一个好处是要组成一个强大的研发团队超越对手,另外一个好处是证明公司财大气粗重视创新。
人工智能的进展和挑战


技术的突破同样也给我们带来了很多挑战。以对抗网络为例,我们这些年都见识了很多这样那样比较魔幻的成果;当年觉得像魔术一样的,现在都习以为常了;比如给斑马换皮肤,把它换成普通的骏马;同样,普通的骏马也能换皮成斑马。还有就是自动生成非常逼真的图片,如人脸等等;同样能够定制各种各样的风格,头发、胡子、眼睛、牙齿等等。另外还可以根据肖像生成视频,模仿人的动作,对嘴型。最臭名昭著的是DeepFake深度造假,可以模仿名人说话,惟妙惟肖,几可乱真。用于娱乐,博人一笑,无可厚非;用于假新闻蛊惑人心,则贻害无穷,令人防不胜防。
以前我们说的假新闻,是以文字形式出现的,现在出现了图文并茂的形式,鱼龙混杂让人无法分辨。Facebook的人工智能,花了很多的工作能去做假新闻的识别,但是它在这方面其实做得并不好,这也损害了这家社交公司名声。


人工智能/深度学习进展在道德伦理方面所带来的挑战更严重, 2015年有一个工程师,他发现在好友的谷歌相册里好友的脸被自动打标成为了猩猩,而他的好友是个黑人;他把他的发现放在了推特上,引起了轩然大波。人工智能技术人员一开始都觉得,这是可以理解的;因为深度学习都是数据训练出来的,数据集里面如果样本不平衡,多数是白人人脸,有色人种的比较少;有可能白人人脸识别的成功率就很高,而有色人种的准确率就差很多。但从道德伦理来说,这些技术错误是不可原谅的,政治上是不正确的;说明种族歧视会体现在算法和数据里。谷歌意识到了这个问题的严重性,很快的在内部成立了人工智能道德伦理委员会。但是很久也没有找到很好的解决方法。谷歌刚开始是开放给大家随便打标的,现在它把这个功能给关闭了,只有特定的作业上才允许使用打标技术。


最近几年,Transformer的兴起也引起了很大的关注。各种预训练模型,比如:BERT、GPT-2、GPT-3, 一旦从超大数据集上训练出来,就可以用于做各种各样的人工智能人物。
例如OpenAI的DALL.E,它是一个具有一百二十亿参数的超大型的神经网络。它能完成的一个作业是:你给它一段文字描述,它可以生成一系列图片,让你来选。比如你要让它生成一个鳄鱼形状的扶手椅,它就能生成这些图片,是不是很魔幻;仔细检查,的确符合你的描述。例如你要让它生成竖琴制成的蜗牛,蜗牛就长成了竖琴的样子。现实中不可能有,但人的语言既然能描述,DALL.E 似乎就能根据描述来描绘出来, 就像我们人类做梦一样。
DALL.E让人惊叹的技能还很多,例如给一幅名画:比如荷兰画家Vermeer的“佩戴珍珠耳环的少女”肖像画, DALL.E 可以围绕着这个半身像去扩展,扩展全身,扩展背景,这样它能够做出一幅超大型的画,并让你觉得都场景都很匹配,叹为观止。


最近,比较热门的一个报道是,有一个人 James Allen用AI的工具 Midjourney,生成了一副画作叫《太空歌剧院》;实际上生成画作比较粗糙,他自己用Adobe的PhotoShop去做了一些细节的加工;然后他拿着这幅画当作是自己的画,到科罗拉多州的艺术博览会上去参加美术比赛,最后获得了头奖。获奖以后,他实话实说,承认这幅画不是他自己做的,是用计算机生成的。参展的人类画家都义愤填膺,觉得不公平,指责他作弊。但是展览会最后还是决定将头奖给了 James Allen,因为他的画作跟别的画作比,的确是可圈可点,令人震撼。


总结一下,人工智能其实它经过了3个阶段;第一阶段是弱人工智能阶段,在每个人工智能的领域,我们都生成一些有效的方法去解决该领域的问题。现在,经过了深度学习的革命,基本上进入了第二阶段,强人工智能(GAI 或AGI)的阶段,它可以举一反三,一套方法就能把不同领域的问题都给解决了,从而把人工智能各子领域重新统一,合而为一。还有第三阶段,就是超级人工智能阶段,现在像Deep mind做的围棋系统,还有科学上的蛋白质折叠系统等等,都让我们对Super AI略见端倪;因为这样的智能,结合了超强的算法和算力,可能是我们个人智能难以企及的。


人工智能被定义成人工智能,其实很有争议。Artificial Intelligence给人的一种感觉好像人工智能是与人类智能相竞争而发展演变的一个智能;加上科幻文艺作品的发挥渲染,有时候会被人觉得人工智能做好了就可以代替人,跟人形成了一种紧张的对立的关系。如果人工智能以超越和替代人类智能为目标来发展,就非常危险,跟当年核武器研发,核军备竞赛差不多,令人担忧。
但是从一开始,也有很多专家指出,人工智能artificial intelligence这个名字不太确切,更确切的不是AI应该是IA,也就是Intelligence Augmentation,强调智能增强/放大;在人的智能的基础上,人工智能应该是个工具,增强人的智能。AI如果是按照IA的这种方向途径去发展,它基本上是可控的,因为遇到挑战的时候我们都回到其工具性考量,要它按照IA的原则去寻求问题的解决。
回复

使用道具 举报

1

主题

6

帖子

13

积分

新手上路

Rank: 1

积分
13
发表于 2025-3-22 13:50:04 | 显示全部楼层
为毛老子总也抢不到沙发?!!
回复

使用道具 举报

3

主题

12

帖子

24

积分

新手上路

Rank: 1

积分
24
发表于 2025-6-27 21:38:27 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|科技一站

GMT+8, 2025-7-6 04:23 , Processed in 0.126510 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表