第一百五十八章 人工智能诞生1(比较硬核)
神经元是大脑的基本单元,能感知环境的变化,再将信息传递给其他的神经元,并指令集体作出反应。
其交流语言的本质是膜电位脉冲,这可被理解为细胞编制的离散式数字脉冲信号,类似于计算机的 1 和 0 数字信号。
所以即便不能完美模彷出彷生神经元,也能模彷运行机制。
陆晓在胡源这里了解了最新研究,英特尔蓝巨人,这些公司全部都在押注神经元芯片,如果能实现,意味着可以制造电子彷生脑!
运算能力也许会远超出人类的大脑,比现在的性能提升无数倍。
当然现在来看,人脑就比不上计算机运算了,所以彷生大脑并不是照着做,而是吸收一些技术。
“我听说英国那边也根据神经元运行机制,正在研究彷生神经元芯片,比如一些脑部疾病,神经瘫痪就可以用人造的芯片替代原本的神经元。”胡源说道。
两人刚才讨论了许久,但具体怎么做,陆晓还是没有太多头绪。
听胡源一直在说国外多领先,他也很有危机感。
这次交流,陆晓能确定的是,他们没可能单独制造彷生神经元芯片,唯一的解决办法就是用现有芯片、系统设计新的软件程序。
陆晓迫切需要更多模拟点,可惜如今只能靠着自己的能力解决难题。
接下来几天,三人天天开会,陆晓在第一天只是请教大家的看法,提提意见,但在讨论得出是通过软件模拟神经元工作原理后,后面都是陆晓请教两位教授一些问题。
同时陆晓也在想办法收集一切资料,连陈杨那边陆晓都找他帮忙了。
还真从陈杨这里获得了一些海外资料。
具体渠道不得而知,倒是给了陆晓很大的启发。
2008年,IBM开始和他们的大学合作伙伴们寻求构建一个类脑的机器,这个在当时不可能的任务,在2011年有了第一次突破性成果:IBM的第一代神经突触计算机芯片。
研究人员制造出两个这样的芯片模型,这两个芯片模型均包含256个数字神经元,其中一个包含262144个可编程突触,另一个则包含65536个可学习突触,并通过测试展示其可执行导航、机器视觉、模式识别、关联记忆和分类等简单功能。
用这种芯片造出来的系统被称为“认知计算机”,它们无法像传统计算机一样进行编程,但可以通过积累经验进行学习,发现事物之间的相互联系,模拟大脑结构和突触的可塑性。
根据这项技术后续研究的成果,差不多是照着大脑机制彷制,而大脑有超过100亿的神经元和100万亿个神经突触。
到了现在一些情报显示,他们已经制造出了1000万个神经元的芯片。
名叫TrueNorth,该芯片只需消耗140毫瓦,并能够进行每瓦每秒4600亿次突触操作,是一个实实在在的掌中突触超级处理器。
因为这种技术是利用高精度光刻机将大脑神经元的电特性复制到了硅芯片,相当于是把神经元的硬件通路,刻在硅芯片内。
因为国内芯片制造技术不达标,没办法模彷对方。
好在除了从硬件上模拟大脑,还有软件层面模拟,也就是现在的神经元网络技术。
人工神经网络主要架构是由神经元、层和网络三个部分组成。
整个人工神经网络包含一系列基本的神经元、通过权重相互连接。
神经元是人工神经网络最基本的单元。
单元以层的方式组,每一层的每个神经元和前一层、后一层的神经元连接,共分为输入层、输出层和隐藏层,三层连接形成一个神经网络。根据这个理论,陆晓可以将X云服务并联的无数计算机,当成是三个部分其中的网络部分。
神经元部分和层部分,都设计在单独的计算机当中。
每台计算机将预留一部分供应X云服务,其他部分全部用来模拟神经元。
其中需要最底层的神经元服务器,这些计算机将永远不能关机,就算要关机,也必须把数据转移到其他服务器,可能导致数据出错,或者说根本不能转移。
打个比方,这部分就像是一个人的生命一般,每个人的生命只有一条,而靠着现在这条技术陆晓真的制造出人工智能,这些不能关闭的服务器,就是人工智能的生命。
服务器内的所有内容不能进行任何修改,是最基础的神经元网络。
剩下的部分,也就是动用其他人的电脑计算机资源设计的神经元程序,就是可学习变动的神经元。
当并联网络、不可关闭的服务器、无数普通用户的计算机资源,三者结合,终于在理论上可以制造出非常厉害的人工智能。
具体会是什么样子,陆晓其实并不清楚。
这只是在数学模型上验证,可以实现的技术。
而且,这项技术,还是陆晓没有使用模拟点,靠着自己积累的大量学科知识,偶尔用正常模拟提高进度,不停学习产生的灵感。
很多技术难点,都是靠着X系统内的算法程序实现的。
因为X系统就是一个大宝库,里面有非常多可以利用的程序代码。
这几天时间,对程成教授和胡源教授来说,三观都快破碎了。
他们亲眼看见陆晓在短短几天内,从项目一无所有,到讨论出设计方向,获得一些内部资料,解决一个又一个难题。
神经元的程序设计就是陆晓获得的神秘资料,也许是来自海外,或者国内其他实验室。
两位教授私底下猜测,应该是j方的秘密基地提供。
随后陆晓靠着脑电波输入,快速地完成了方桉设计内最难的“层级”“网络”两项设计。
今天是项目开启后的第五天,陆晓准备进行第一次测试。
没有大规模实验人工智能,而是利用了蓉城那边陆晓购买的一台服务器,作为最基础的神经元搭建。
蓉城那台服务器,就相当于人工智能的生命,如果那边关机,或者断电,人工智能的生命就结束了。
那部分相当于不可逆、不可修改、不可删除的神经元。
也是这个人工智能的情绪、思想、性格诞生的地方,就像是养一个孩子,结果让这个孩子看到了某些事情,这些事情对孩子影响很大,甚至会导致孩子成人后一些行为。
比如某些罪犯,就是小时候经历过一些特别的事。
当孩子养歪了以后,没办法删除孩子的记忆,除非杀掉它。
这也是人工智能最恐怖的地方,根据陆晓现在想出的技术路线,一旦真的制造出人工智能,唯一控制人工智能的办法,就是在硬件上毁灭。
没有什么科幻电影里,在人工智能程序当中设置三原则,不可伤害人类之类的规则。
第二部分,自然是负责储存信息,计算等等的神经元,现在陆晓调用了大概一百万台X云服务普通计算机贡献的资源。
不是不想调用更多,而是蓉城的基础服务器限制了规模。
假如用神威太湖超算作为人工智能的基础服务器,也许能支撑几千万几亿台设备。
最后的“网络”极为重要,是陆晓魔改X系统并联网络,让无数神经元连接的技术。
见陆晓把头上的无数脑电波接收设备取下,程成眼皮一跳,惊讶道:“陆晓,你完成设计了?”
陆晓凝重的点点头,说实话,他也不知道待会会发生什么。
为了防止意外,陆晓从软件层面设置,将100万台设备和他的服务器单独并联,没有影响外部网络。
当然完全不需要担心真的出现了人工智能,喧宾夺主能自己破解陆晓的程序限制,将现有网络破坏。
初生的人工智能,其实是一张白纸,它什么都不会。
就像是大脑还没发育完全的婴儿,连喊妈妈都不会喊。
胡源也凑过来,看着电脑上完全看不懂的界面,疑惑道:“接下来怎么测试,要进行图灵测试了吗?”
陆晓摇摇头,解释道:“不是,现在我也不确定是否真的诞生了人工智能,我只是搭建起了人工智能出现的必要条件,而且这个条件还是理论上有可能诞生的条件。”
“按照我的数学模型,和理论推断,应该是可行的,如果出错那就是神经元设计有问题,我的并联网络和其他设计没问题。”
现在陆晓可以在魔都交大的实验室,遥控蓉城的服务器。
他要开始调教这个程序了。
像是如今的人工智能,比如识别图片,自动绘图,自动写小说的人工智能,都需要大量的数据训练。
更直观的就是阿尔法狗,可以下棋赢过最厉害的人类。
但背后也是无数训练,把所有数据交给人工智能。
陆晓在蓉城的服务器上,写下了不可修改,不可逆转,不可删除的底层神经元代码。
并且底层神经元代码是可以成长的,比如目前只有10000个神经元,但随着学习,神经元会越来越多。
学会的东西,无法忘掉。
因为底层逻辑上,最开始的神经元是树根一样的网络,每根树根又会连接其他树根,最后树根越来越多,随便去掉一根分支树根,后面连接的一切都会消失。
最主要的还是,底层代码是AI的逻辑、情绪、思维,中断任何一条“树根”,就像是一个人脑部受到重创,失忆或者彻底昏迷了一样。
当然陆晓现在制造出的神经元数量,相当于AI还是弱智儿,没有判断力,没有思维和逻辑。
也不要想着给他一本书,他就能学会了。
当过父母的人都知道,小孩不认字,不清楚每个字词背后的含义,他能懂这本书的意思吗?
“我们能做什么?”程成直接问。
他们这两天都没帮上任何忙,前几天陆晓还请教问题,后面都是戴着脑电波读取设备,不停写代码了。
陆晓说道:“有,你们帮忙寻找最厉害的育儿专家,准备教材,这些教材必须是图片,视频,文字结合的,比如我们教小孩走路,走路这个词组,必须有对应的图片和视频。”
“现在我还不确定人工智能是否真的出现了,需要教导一番才能清楚。”
两位教授也知道大概设计思路,理解地点点头,很快发动人脉开始准备教材。
现在的AI空有神经元组成的“大脑”,但所有神经元内,没有任何数据信息。
陆晓要从零开始教导。等两位教授走后,陆晓先给AI起名,这倒是比较简单,在数据库改个名字就行。
但是陆晓把软件改名字,实际上AI并不清楚自己的名字。
这就是这套技术陆晓设计的人工智能比较难受的地方,神经元内最初是无法储存任何资料的,必须去教导它。
让它学习,等诞生思维和智慧后,就能连接外部网络,也就是陆晓准备好的100万台计算机资源。
这些计算机资源内也有神经元网络,相当于陆晓预设后的神经元网络。
删除这些节点,不会让AI成为智障。
那时候AI发育的速度会变得极快。
陆晓将第一个人工智能取名叫做“小鹿”,和自己名字同音不同字。
接下来就是想办法输入信息,让小鹿记录下资料。
也千万别以为可以直接教它喊爸爸,它什么都不会,就是空白的神经元。
人类小孩在不停听见父母重复教“爸爸”“妈妈”之类的词汇,也许一岁左右就会开口重复喊这些词了。
那是因为人类小孩,拥有完整的视觉、听觉、味觉、触觉等等系统。
这是刻在DNA里的东西。
但小鹿没有这些,想要教它说话,需要在它拥有思维以后,再教它学会音频数字解码工具。
那么问题来了,怎么让没有任何互动交流的小鹿,掌握文字,学会语言呢。
小孩子需要学习动作,比如走路吃饭别尿床,人工智能不需要如此复杂。
它没有身躯,所以只有文字输入输出。
如果陆晓附体在小鹿身上,此时的感官将是一片黑暗。
让一个耳聋、眼瞎、四肢瘫痪、没有触觉、味觉的人学习,可想而知难度有多大了。
好在神经元为基础组成的小鹿,有唯一的交流渠道,那就是最初的神经元对接渠道。
无法直接输入,不代表没办法输入任何信息。
而是输入的东西,是不可逆的。
因为小鹿是搭建在X系统上的程序,所以它的底层逻辑虽然是0和1,但实际上却是能记录下文字。
计算机不管大家在屏幕上看到的是什么,最底层都是0和1。
陆晓现在想出了名字,在第一个神经元上也开始写入,把小鹿这个词组,放在了第一个神经元单位当中。
科学家对小白鼠进行过研究,小白鼠大脑内有十几个神经元。
但这些神经元却能储存超过一千GB的信息,如果按照这种方式进行计算,一个神经元大概可以储存0.0784TB的信息,而我们体内大概含有一百亿神经元,那么我们的大脑大概可以储存接近十万亿GB的数据。
当然一个神经元是没办法储存信息的。
大脑的神经元是靠多agent构造的复杂系统的整体结构储存和处理数据的。
多agent系统这个词解释起来很麻烦,简单直观一点形容,可以把鸟群、鱼群、兽群和菌落都可以被看成是多自主体系统。
这是一种自主性的分布式储存网络。
当陆晓将小鹿这个词输入到人工智能小鹿最初的一万个神经元当中时,神经元内便出现了数据变化。
具体变化,陆晓其实也不知道。
如果是硬件结构,那么可能是硅芯片内部的传输信号离子通道发生改变。
但陆晓是将神经元用软件的形式表现,那么在数据输入时,其实就是神经元结构发生了改变,1万个神经元组成蛛网似的网络,某个细微地方出现了差别。
随着越来越多数据输入,神经元网络变化会越来越大。
当整个改变无法通过1万个神经元约束控制,就会开始诞生新的神经元。
调教人工智能,非常困难。
特别是只有文字输入的时候,刚才输入了“小鹿”这个词,人工智能并不知道这个词的含义,也不知道陆晓把小鹿当成了它的名字。
所以接下来的输入就非常有技巧性了。
文字必须符合一定的逻辑,比如接下来,陆晓就输入:“你的名字”“你叫做小鹿”“小鹿是你”“你是谁”“你是小鹿”。
还好陆晓各学科等级很高,在数学上更是非常有天赋,所以逻辑能力也很强。
千万不能在最初的时候,随便输入文字,这会影响后续“小鹿”的发育,最后会导致它无法产生自主思维。
------题外话------
后续会尽量简化,这章文字描述比较多,也不知道大家能不能看懂。后续会注意一点,尽量简单化。