“下一步最重要的科学发现,一定来自数据驱动的创新。”11月21日的世界互联网大会数字经济论坛上,中国社会科学院大学教授、国务院原副秘书长江小涓表示,创新范式的改变,又带来创新主体地位的变化,企业的重要性极大提升,因为企业有数据和算法。
江小涓说,和原来科学研究靠观察、实验、计算、推理的模式相比,数据驱动的创新将成为创新最重要的范式。数据驱动创新的突出特点在于,能够解决高度复杂的科学问题。
她举例说,对于蛋白质结构测试,过往需要在实验室用冷冻电镜开展,测试时间长且成本高。但谷歌开发的谷歌AlphaFold模型,直接用数据之间的关系来探测蛋白质三维结构。今年的诺贝尔化学奖,便授予谷歌AlphaFold的开发者。
当创新范式转向数据驱动,江小涓认为将极大提升企业在科研领域的重要性,“现在只有大平台才真正能够找到大数据、找到算力、找到算法”。
江小涓以大模型的创新主体演变为例说,2014年以前,最前沿的大模型诞生在高校,而2014年是一个转折点,研发范式改变,从此以后最领先的AI大模型是产业界做出来的。
“这是非常重要的变化。”江小涓表示,科研分工的模式边界需要重新界分,“一定要把更多的研究经费往大企业投”。
数据驱动创新离不开数据供给。江小涓呼吁,各类主体要把数据释放出来,支撑数据时代的创新。比如,现在互联网金融机构可以用数据为用户进行可信度画像,但仍然缺少来自传统银行的客户数据。如果大型金融机构能把数据开放,将有望推动互联网企业的创新。
江小涓说,数据开放不仅仅为了增强企业自身业务,更大的价值在于数据的复用。数据和土地不同,数据可以无限次复用。中国最大的优势是数据量大,只有促进更多的数据开放共享和开发利用,才能推动海量数据加快推进科技创新的愿景。
采写:南都记者 杨柳