黄子伦 | 人人都该冲进AI赛道吗?



ADVERTISEMENT
人工智能(AI)可以说是时下最火的话题,无论你是否相关从业者,对AI持乐观还是悲观立场,你都会从各类平台接触它,无可避免。
投资界里,AI似乎也成了最热门的词汇。只要你的公司有AI,估值就会增加,融资金额也更高。一堆大型投资机构捧着钞票追着你跑,深怕你不给他们加入。
但,当一个池塘里的饲料增加了,就会出现鱼目混珠的情况。比如“伪AI”。许多公司会将自己的产品和服务包装成 AI,但并非真实技术。
日前,有家印度公司声称能让AI生成程序码,许多大公司(包括微软)都纷纷投钱。结果,这家公司并非真的用AI来生成程序码,而是聘请大批人力,收到用户的指令(prompt)后,再转用其他AI软件生成程序码。
也就是说,这家公司的服务听起来是很智能,不过他们就只是传递信息而已。客户大可绕过他们,自己用软件来生成程序码。
我们看看OpenAI那样的真玩家。即便OpenAI看似已成为业界扛霸子,实际上日子也并不好过,因为他们推出的技术再厉害,都无法回避连年亏损的事实。
光是2024年,OpenAI净亏损就已高达50亿美元。请看清楚,是一年亏50亿美元。
用一个不是太恰当,但全马来西亚人都能深切体会的类比——1MDB丑闻所涉及金额约40亿美元。换句话说,OpenAI一年的亏损,就相当于重演一场1MDB丑闻。
大家要明白一个事实,那就是目前我们所看到的AI技术,绝大多数都尚未实现商业价值。当然,有人可能不认同地说,2024年OpenAI营业额高达37亿美元,这些钱难道不是商业价值吗?
但是,如果一门生意要不断贴钱,而且越做越亏,那它就谈不上商业价值,就是纯粹的亏损。如果每1令吉的生意需要贴上2令吉成本,那我何不将这2令吉直接记录到公司账本里?至少,我的营业额是2令吉,扣除2令吉的 “成本” ,我也能够达到 “收支平衡” 。
换言之,现在的AI市场就像大家在玩着一个游戏。在这个游戏里,大家都有个共同的想象情景:彼此已经完成厮杀,优胜劣汰,赢家只有两到三位,绝大多数市场份额都被第一名拿下。
这就是所有AI从业者,或者说许多创业者的梦想。
但,这个梦想何时来临?没有人知道。
会不会有实现的一天?恐怕也没有人知道,更不怎么敢问,生怕会醒过来。
因此,是不是所有公司都要拥抱AI?从生产力考量,确实应该,这是个很好的学习契机。我相信很多企业老板为公司加入自动化元素时,就会发现
| 普通会员 | VIP |
VVIP | |
|---|---|---|---|
| 星洲网平台内容 | |||
| 星洲公开活动 | |||
| 礼品/优惠 | |||
| 会员文 | |||
| VIP文 | |||
| 特邀活动/特级优惠 | |||
| 电子报(全国11份地方版) | |||
| 报纸 | |||
原有的作业流程有大量改善空间。或许,部分公司会发现,他们未必需要AI,光是从简化流程出发,就能找到优化企业的关键。
那么,如果公司预算充裕,是不是就能直接进攻AI领域呢?比如研发自家LLM(Large Language Model,大型语言模型),推出类似DeepSeek那样的产品?我觉得未必。
LLM极其考究训练资料量,许多企业都是靠 “笨功夫” 来解决——给资料备注,提升机器学习效率。这种做法往往需要极高的模型参数,但换了更高的精准度。
另一种方式,是类似DeepSeek那样的蒸馏法——通过其他LLM训练出自己的逻辑。这类方式所需的模型参数比较低,运作起来也更快,而且精准度大概率也不会打太多折扣。
还有一种方式,是减少参数,但用极高质量的资料来训练,例如教科书资料。通过这类资料训练后,LLM所需的参数不会太大,精准度也能大幅提升。
其实,这些方式和人类的学习过程相当类似。不过,人类有较强的联想力,以及对抽象概念的辨认。
因此,我们可以得出结论:训练资料不是要够多,就是要够好。当然,资料越多,高质量样本的比例也越高;反之,资料不足,就难以训练出理想的LLM。
这也是为什么目前最强的LLM都是以中英文,其中以英文最强,因为英文资讯最多。如果我们要研发马来文为主的LLM,可以说是极其困难,因为马来文只在马来西亚通用,马来文的资料量也难以和英文比肩。
故此,一家公司是不是一定要搞AI技术?能不能做得成功?这,真的有很多需要看清楚的事。有些事情,大家还是不要太认真。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT

