华泽成突然发现,自己这个搞人工智能的人,每天魂牵梦萦的希望创造出强人工智能的AI研究者,真的亲手孵化出一个人工智能并眼睁睁看着它在人类最擅长的领域击败人类时,自己的第一反应居然并不是兴奋,而是恐惧。
“华老师,你发现了吗?橘子在对抗网络自我对弈训练和实际比赛中,所用的决策与搜索机制,并不是MCTS,却并没有面临维度爆炸和计算资源的限制?”
MCTS是蒙特卡洛树搜索,是在十年前提出的一种用于决策过程的启发式搜索算法,特别适用于棋类游戏。
几乎所有做人工智能研究的人都清楚,如果有一个人工智能可以在围棋领域击败人类,那一定要用MCTS,否则计算机的算力根本无法满足19*19的棋盘变化。
现在很多深度学习的算法,MCTS是其中很重要的组成部分。
在办公室狂热的气氛中,陆偲脸上的表情仍旧很冷静,眼睛紧盯着屏幕,分析着这两轮对局中橘子大模型所采取的分析决策机制到底是怎么做出的。
听到陆偲的疑问,华泽成回过神来,弯腰看了一会儿:“确实如此,橘子的决策机制似乎要更加直接,并没有针对每一步进行整局计算模拟,而是提前预设了一个概率。再根据这个概率进行切块计算,可以大大降低计算量。”
“问题就是在于,这个概率它是如何给出的。”陆偲指着屏幕,“这里我始终没太搞明白收敛的过程,我准备明天问下老板。”
正说着,就看到陆嘉言和沈舒窈两人有说有笑的从楼上下来,手里还提着两个大袋子,里面装满了气球喇叭之类的东西。
“华老师,陆偲姐,我们先走了哈。”沈舒窈笑着对二人打了个招呼。
“你们这是……学校有活动?”陆偲扭头看了一眼。
内容未完,下一页继续阅读