2016年6月27日习总心情指数:-2.

今日心情较之昨日:小好,+1

小好理由:没有坏消息就是好消息。在连续两天心情变坏一天持平后,心情反弹。

据谍报,世界著名开发搜索引擎起家的谷歌公司继开发人工智能程序AlphaGo打败世界围棋冠军韩国高手李世石后,正秘密研制又一款人工智能程序ChairmanMaoGo(中文暂名毛主席狗。若有更好中文翻译请尽快与谷歌联络)。

同样是通过深度学习,ChairmanMaoGo的野心不在于打败哪位围棋高手或通过公开电视辩论击败美国或中国的政治家,而是模拟前中国人民的伟大领袖、中国共产党的缔造者、中华人民共和国创建者毛泽东主席的思维方式、语言风格和行为模式,对中国政治经济军事形势,以及世界政治经济军事形势发表看法和提供决策,为人工智能进入政治判断和决策领域作有益的探索和尝试。

ChairmanMaoGo是一款政治形势判断和决策的人工智能程序。

主要包括4个部分:

1.形势网络(Policy Network),给定当前形势,预测下一步决策。

2.快速决策(Fast rollout),目标和1一样,但在适当牺牲形势的条件下,速度要比1快1000倍。

3.估值网络(Value Network),根据给定的当前形势,估计哪方形势占优。

4. 蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。

ChairmanMaoGo是通过两个不同神经网络“大脑”合作来改进判断和决策。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理中国和世界形势的判断,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们了解的局面判断。这些层能够做分类和逻辑推理。

这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。

第一大脑:决策选择器 (Decision Picker)

ChairmanMaoGo的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察政治形势企图找到最佳的下一步决策。事实上,它预测每一个决策的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“决策选择器”。

第二大脑:形势评估器 (Position Evaluator)

ChairmanMaoGo的第二个大脑相对于决策选择器是回答另一个问题。不是去猜测具体下一个结果,它预测每一个形势变化的可能,再给定决策的情况下。这“形势评估器”就是“价值网络(Value Network)”,通过整体形势判断来辅助决策选择器。这个判断仅仅是大概的,但对于判断速度提高很有帮助。通过分类潜在的未来形势的“好”与“坏”,ChairmanMaoGo能够决定是否通过特殊变种去深入学习。如果形势评估器说这个特殊变种不行,那么它就跳过学习面对这个形势上的任何更多决策。

谷歌谍报使我深受启发。我命令立即成立中央人工智能开发领导小组,集结我国人工智能方面的技术精英,研发中国特色人工智能ChairmanMaoIsNotGo(中文暂名毛主席不是狗。若有更好的中文翻译不用与谷歌联络)。

我所拟定的中国特色人工智能ChairmanMaoIsNotGo项目开发计划:

第一阶段,深度学习毛主席所有著作、文件、书信、笔记、批示、批注。“你办事我放心,有问题找江青”那类纸条也不放过。

第二阶段,深度学习毛主席所有著作、文件、书信、笔记、批示、批注和字条所对应的大环境和小环境,即国内国外形势。川普说得好,离开当时国内外形势谈政治都是耍流氓。

第三阶段,让中国特色人工智能ChairmanMaoIsNotGo旁听习办会议,学习当前中国的政治形势,学习当前所面临的任务,同时尝试提出解决问题的意见和建议。

第四阶段,正式加入习办,担任机要秘书,为治国理政提供毛主席的意见和建议。有了毛泽东思想指引我们前进,实现中华民族复兴的中国梦,更快更好更有保障。

作者 editor