第622章 算法壁垒(1/2)
国家信息中心三楼会议室,巨大的屏幕上展示着一套复杂的算法模型: 节点、连线、权重系数、决策树,层层叠叠,像一张精密的蛛网。
林万骁坐在会议桌一端,身旁是发改委投资司、区域司、高技术司的司长们。对面是清华大学、北京大学、中国科学院的三位教授,以及他们带领的技术团队。屏幕上的算法模型,就是这个团队耗时三个月开发的“中央投资智能分配决策支持系统1.0版”。
“林主任,各位领导,我先汇报系统原理。”清华大学计算机系的李教授站起来,四十多岁,说话带着学术腔,“系统核心是多目标优化算法。我们设定了五个一级目标:经济效益、社会效益、生态效益、区域协调、风险防控。每个一级目标下又有若干二级指标...”
他讲得很投入,但林万骁注意到,身边的几位司长已经开始走神。周振华在笔记本上无意识地画圈,李春梅低头看手机,赵立军则盯着窗外,显然,这些技术细节对他们来说太抽象了。
“...通过机器学习,系统可以自动识别项目特征,匹配合适的权重系数。”李教授继续,“比如一个西部地区的生态保护项目,系统会自动调高生态效益和区域协调的权重,降低经济效益的权重。”
“等等。”区域司司长李春梅终于忍不住打断,“李教授,你这个‘自动调高’‘自动调低’,依据是什么?”
“依据历史数据和专家打分。”李教授解释,“我们收集了过去十年所有中央投资项目的评审资料,训练模型识别成功项目的特征...”
“那不就是‘经验主义’吗?”李春梅一针见血,“过去的经验就一定对?如果过去就有问题呢?”
会议室气氛一下子紧张起来。
林万骁没说话,静静看着。他知道,这才是真正的难点,不是技术问题,是信任问题。
“李司长说得对。”北京大学的经济学教授接过话,“所以我们引入了‘动态调整’机制。系统不是一成不变的,会根据新项目的实际效果反馈,不断优化模型。”
“那谁来保证这个‘反馈’是真实的?”投资司司长周振华开口了,语气很硬,“李教授,我不是质疑你们的技术。但你要知道,在地方报项目的时候,数据就可能有问题。为了多拿钱,有些地方会把效益往高了说。你用这些数据训练模型,模型不就学歪了?”
技术团队沉默了。这是个根本性问题,垃圾进,垃圾出。如果输入数据就有水分,再好的算法也没用。
林万骁这时才开口:“周司长提的问题很关键。但我们换个角度想,如果没有这套系统,我们怎么判断地方报的数据是真是假?”
周振华一愣。
“靠经验?靠感觉?还是靠...关系?”林万骁看着在座的人,“过去这些年,我们批项目,有多少是真正看数据的?有多少是看报告写得好不好,看地方领导会不会‘做工作’?”
这话很重,没人接话。
“我不是说系统能解决所有问题。”林万骁缓和语气,“但至少,它能提供一个基准,同样的项目,在同样条件下,应该得多少分。地方可以申诉,可以解释特殊情况,但不能乱来。”
他转向技术团队:“你们这个系统,最大的价值不是‘代替人做决策’,而是‘给人做参考’。把复杂的因素量化、可视化,让决策者能看到:如果按这个标准,项目能得多少分;如果照顾特殊情况,要调整多少。”
李教授眼睛一亮:“对!就是这个思路!系统不是最终裁决者,是辅助工具。就像医生看CT片,机器能看出病灶,但怎么治疗,还得医生定。”
这个比喻很贴切。几位司长的脸色缓和了些。
“但还有个问题。”高技术司司长赵立军说,“中国的复杂性,机器能懂吗?比如同样一个产业项目,放在东部可能很好,放在西部可能就不行。这涉及到产业链配套、人才储备、市场环境...这么多因素,怎么量化?”
技术团队再次被问住了。
林万骁想了想:“那就不追求‘完全量化’。有些因素可以定性评价。系统给出定量建议,决策者根据定性因素做调整。关键是,调整要有理由,要记录在案。不能今天张三来说情,调一点;明天李四来说情,再调一点。调到最后,规矩全没了。”
会议又进行了一个小时。技术团队详细讲解了系统的操作流程、数据校验机制、安全防护措施。几位司长也提出了很多实际问题:系统会不会被黑客攻击?数据泄露怎么办?如果系统出错了,谁负责?
本章未完,点击下一页继续阅读。