之所以会起这个标题,源自于前段时间笔者的亲身经历,上个月我利用ZhipuAI结合开发了一个阅读PDF的AI小工具,还没开始正式使用,突然发现KimiChat已经支持20万字的超长文本输入,意味着你可以直接塞入一整套知识库进去。再回头看看自己写的那个工具,才越发觉得所做的一些努力不值一提。

这不禁引发我的思考,移动互联网时代,个人开发者以极低的成本(一台电脑,一部手机)开发出独立作品的场景,在如今的大模型的时代变得不再现实。那个年代,代码稀少,因此程序员的薪资才水涨船高。可生成式AI的出现,让代码生成的成本变得更低,代码在这个时代变得越来越不值钱。

你问我焦虑不焦虑,那肯定是焦虑的,真的很焦虑。尤其在对比了国内外的现况后,变得愈发焦虑了。似乎海外一直在高歌猛进,Google、Meta、OpenAI等大公司军备竞赛,NVIDIA股票节节攀升,各种开源工具应接不暇。反观这里,仍然一直发布着各项评测结果遥遥领先,但实际效果一般的大模型,颇有一种被世界甩在身后的感觉。

笔者常年在互联网上划水,算是比较先接触AIGC和大模型的,期间也陆陆续续写过一些文章。从一年多的使用来看,大模型真的很强,强到帮我写代码,根据大纲编辑文字,给我提供各种思路和解决方案。但同时大模型也很弱,弱到我问他鲁迅和周树人是什么关系都会瞎说。这种矛盾带来的割裂感让我陷入了深思。技术,尤其是像生成式AI这样突破性的技术,始终带有双刃剑的特质。其一面能够无限放大人类的创造力,简化日常工作,提升效率;另一面则是误导信息、扩张偏见,让你无法分辨究竟什么是真,什么是假。因为大模型对于输出错误答案和输出正确答案同等自信,以至于在某种程度上反而增加了人类获取真实信息的成本。

大模型时代的开源

借着这个话题,探讨一下如今这个时代大模型开源是否还有意义。

首先,开源作为一种协作模式,是鼓励开发者共享知识和资源,这样可以加速技术的迭代和创新,同时也降低了参与门槛,使得更多的企业和个人能够参与到AI大模型的研发和应用中来,颇有一种众人拾柴火焰高的意思在里面。但是现在,我们发现各种性能卓越的大模型都是闭源产品,无论是GPT4,还是Gemma,都是大公司的产品。OpenAI在成立之初,是希望让AI服务于每个人,但是现在越来越多的人调侃他们变成了CloseAI。

闭源可以保护商业模式,聚集人才和算力资源,反观开源社区的很多成员都是个人开发者,没有足够的算力支持,所以观察GitHub可以发现一个规律,大公司不断发布自己最新最强的大模型,个人开发者不断的发布自己的各种调用大模型API的应用和工具。

也许未来开源社区会成为反哺这些大模型公司生态重要的一环。

大模型之于我们

这几天腾讯新闻有两篇文章值得看一看。分别是《朱啸虎讲了一个中国现实主义AIGC故事》和《月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进

这两篇文章介绍了中国科技界对大模型的态度分裂成两股阵营,一方认为应该追求更大更强的AI能力,另一方认为应该将足够的AI能力投入可以快速变现的商业场景中。

其实,杨植麟和朱啸虎并不是对立的。在中国也可以做大模型,但是要基于两个真相。第一,阿里这类云计算厂家会砸钱,反正大模型买我的算力,甚至投资款都用算力支付,云计算规模上去还可以打价格战,一石多鸟,空手套白狼。第二,大模型作为基础设施,中国肯定要自主可控,不管好不好,肯定要有。

这些机会,属于杨植麟这样的,和杨立昆一起发过paper的天之骄子。而普通人做AI,多听听朱啸虎说的,不要挑战高大上的科研,一定要做应用,一定要想办法快赚钱,养活自己。

套用《一代宗师》的台词 —— 今天我们不比武功,比想法。

那么未来AI的走向会是什么样的呢?

悲观的预测,这轮AI是元宇宙,泡沫破裂,英伟达成为思科。又或者这轮美国的AI,成了中国的5G,的确遥遥领先,但是烧了那么多钱,却找不到爆款应用。中性的预测,这轮AI是互联网。前期技术曲线陡峭,后期变得平缓,中国能慢慢赶上来。再次印证,美国擅长底层技术,中国擅长应用落地。最乐观的预测,这轮AI是AGI,scaling law带来的强人工智能,是黑客帝国,是人类被全面超越和奴役的开始。

但是不管怎么样,我们都不应该焦虑,饭是一口一口吃的,路也是一步一步走的,我们注定不是会引领世界的一批人,因此让自己站在巨人的肩膀上才是我们要做的。历史课本上说人类进化的重要标志是学会使用工具,现如今大模型是进入信息时代以来,人类最伟大的工具,你能够直接调用人类千年以来积累的知识与技能,这些足以让你变得十分强大。