【灼见】掌握AI就掌握话语权/蔡元评
人工智能(AI)正在火热起飞。AI是21世纪工业革命的核心技术;和纳米科学、基因工程,同列为三大尖端科技。
AI对国际秩序、生活型态、经济发展、军事布局,都带来颠覆性的影响。各国纷纷投入资金调研开发,确保其沉淀为国家的一级战略。
高效准确解决人间事
顾名思义,AI以人类的智慧与思维为基础,设计更高明的机器,高效准确地解决人间事。简言之,打造人脑的扩充版。
AI领域非常广泛,涵盖机器人、机器学习、图像识别、语言识别、自然语言处理、计算机视觉等。它模拟人类脑神经;具备自主的感知、认知、学习、推理、思考、规划、决策与执行等功能,而且符合人类情感和伦理!
AI模拟、延伸和扩展人类智能,以高智的机器提高人类的能量,把事情做得更好、更准确、更省事省力,而且能够“举一反三”!
写稿人必备的Word,是早年微软文字处理的AI极品。它彻底解决了稿件的各种问题,比如修改、排列、造句、资料、传送等。
2022年,美国OpenAI推出ChatGPT,一种AI驱动的自然语言处理工具。人们提问,机器人会以聊天的方式回应,感觉像是与朋友对话。ChatGPT立即刮起了风暴,惊艳四方。
近期,出现了一款叫Stable Diffusion扩散模型的AI,只需要输入一段文本,SD就可以迅速将其转换为图像或视频。例如根据《唐后行踪图》和《历代古人像赞》文献,即出现武则天画像和长安当年的荣景。细节虽无从考证,但它依凭古籍,推演古社会,比人脑更灵巧!
美中高居全球第一梯队
AI有4个基础:感知器、运算器、控制器、输入输出,类似人体的机器版。感知器是感官,获取信息;运算器是信息计算中心,处理资料;控制器是大脑,控制和协调行为;输入输出是对外的接口和通道。
算法、模型、数据集,是AI运作时的3元素。算法是其核心,自动执行任务;模型负责思维,模拟人类的思考;数据集是资料库,提供必要的信息。
以规模、强度和投资比较,美国无疑是AI先驱;中国虽排行第二,但落差显著。美国领先归功于人才鼎盛,以及大量私营资金的赞助。2022年,美国AI初创企业投资达270 亿美元,中国仅53 亿。不过,从AI研究出版物数量、论文被引用次数,以及专利申请量观察,中国开始出现“后起之秀”弯道超车的力道。
硅谷的OpenAI、Google、Meta、Anthropic是美国AI的佼佼者。OpenAI开发的GPT-4语言模型,对语言理解、解析和生成等功能非常高端。OpenAI每周用户高达1亿,被业界视为“下金蛋的鹅”。2023年,拜登政府抛出244亿美元展开AI,估计政府和民间投资总共874亿。
中国由腾讯、华为、百度三强棒领军。腾讯研发的“混元”大语言模型,华为涵盖语言、视觉、多模态的“盘古”系列,以及百度媲美ChatGPT 的“文心一言”,也都各领风骚,唱红一片天。中国政府设定AI为国家重点战略和优先发展的项目,预定到2027年时,提高预算达381亿美元。
AI决定全球政治版图
中国的优势是青年人才储备。高等教育毛入学率已达60%,每年高校毕业生高达1000万,而且理工科的比例很高。当然,中国也存在亟须解套的短板。第一,基础理论和原创算力薄弱。第二,高端器件研发能力,比如 CPU图形处理器落后。第三,缺乏权威的高手主持AI平台。
中美是全球AI遥遥领先的第一梯队,其后的英国、以色列、加拿大、法国、印度、日本、德国等,也都扩大AI投资,但规模远不如中美。
今年1月,美国政府再向中国AI领域扔下“震撼弹”。商务部公布《采取额外措施应对恶意网络相关国家的紧急条款》,要求云服务(LAAS)厂商提供服务时,验证外国用户身分、限制其使用、并详细报告大模型的外国交易,确保美国安全和利益。商务部长雷蒙多直言:“美国须全力阻止中国企图从美国手中取得AI大模型的算力。”
过去一年,美国使出各种招数,限制半导体和芯片出口中国,今年加码管制,再祭出AI算力禁令。“恐中”、“抗中”、“防中”已到了歇斯底里、杯弓蛇影的地步。
“十年磨一剑,锋芒待展”。登峰造极离不开磨砺与坚持,掌握AI就掌握话语权。中国能否扭转乾坤,就看未来5年。
问ChatGPT问上瘾 AI时代公司数据安全吗?
了解多一些:大语言模型与聊天机器人关系
大语言模型(LLM)是一种基于大量数据进行预训练的深度学习模型,拥有数十亿甚至数兆的参数并通过学习海量的文本数据(例如互联网上的书籍、文章、网页等)来理解语言的语法、语义、上下文,并掌握丰富的知识。
其核心能力是理解、生成和处理人类语言,它可以执行多种任务,如回答问题、总结文档、翻译语言、创作文本、编写代码等。
LLM“产品”或“应用”
时下的开源LLM包括Open AI的GPT、Meta的Llama、深度求索DeekSeek、mistral(欧洲开发)、谷歌的Gemma、阿里巴巴的通义千问等。
如果说LLM是技术的核心,那么ChatGPT类聊天机器人则是基于LLM的“产品”或“应用”,它基于大型语言模型构建,并经过额外的微调来使其更适合进行流畅、自然的对话交互。
用汽车为例,LLM就像汽车的引擎负责提供动力,而ChatGPT就像一辆完整的汽车,它把引擎(LLM)装配起来,加上座椅、方向盘等其他部件,最终成为一辆可以直接驾驶和使用的产品。

刘哲涵表示:如果偶尔输入一些敏感信息,可能没那么快出问题。但如果大家不断地输入类似的信息,AI模型就有可能“记住”这些数据,并在某些情况下,让这些信息被不该看到的人看到。
报道:郑美励
摄影:谢德煜
无论你是否察觉,从个人日常使用ChatGPT安排旅行计划,到企业利用AI进行数据分析、生成报告、自动化流程……社会正逐渐被人工智能(AI)渗透。AI无疑是提升效率与便利的利器,但它亦是柄双刃剑,若运用不当,潜在的风险不容忽视。我们该如何驾驭AI的优势,同时规避其可能带来的负面影响?
AI聊天机器人,如ChatGPT、Gemini和DeepSeek因其易用性和强大功能在全球范围内迅速普及。无论公司是否知情或允许,许多员工在工作中借助这些工具,而企业敏感或机要信息外泄的风险便随之增长。
2023年,三星一名软体开发工程师在资料库程式开发期间发现程式码错误,于是将整份程式码复制贴到ChatGPT对话中,以寻找臭虫及解决方案。
好消息是,AI迅速替他解决难题,坏消息是几天后,公司资安部门追查一则异常流量,才发现那段程式码早已将未公开的技术机密暴露于开放平台。其他外泄的资讯还包括半导体设备量测资料库、生产/瑕疵设备相关软体,以及一份公司会议语音转录的文字记录摘要。
该公司原本因资安考量而禁止员工使用ChatGPT,后来在员工要求下解除禁令,不料使用不到20天即发生连续泄漏公司机密事件。
问ChatGPT泄露机密
这仅仅是众多泄露案例中的一个缩影。AI数据科学专家刘哲涵博士指出,ChatGPT类工具的普及使许多公司都面临着相似的挑战。例如,某些企业基于资安考量而屏蔽ChatGPT,但却没有屏蔽谷歌或其他类似的AI工具。更重要的是,员工总有办法规避公司限制。他们可能不会使用公司电脑上传敏感信息,而是利用个人手机或电脑。在这种情况下,公司很难做到滴水不漏地防范信息泄露。
他直言,想要完全杜绝信息外泄几乎是不可能的,除非公司采取极端措施,比如完全禁止员工上网,并要求所有工作数据仅限在公司内部处理。即便如此,也无法保证百分之百的安全。
正确使用AI工具
尽管无法完全消除泄密风险,但仍可采取一些措施来降低风险。公司组织层面可制定清晰的AI使用政策、培训员工和提升醒觉度、部署数据防泄露系统和网络监控工具,进行监控与审计、限制使用等;而员工、个人层面在使用数据时,务必对数据进行分类处理:
●公开数据
可在公共领域获取的数据,例如公司注册信息可在公司委员会查询,属于半公开性质,这类数据上传至聊天机器人平台,风险相对较低。
●敏感数据
包含个人身分信息,如电话号码、身分证号码、信用卡交易记录等。这些数据一旦泄露可能会带来风险。他提醒,这类数据必须进行处理,移除或替换识别性信息,例如隐藏电话号码的中间几位、身分证号码的多数号码等,以降低泄露风险。
●机密数据
属于企业或个人核心资料,例如军事机密、半导体公司的研究数据、医疗病患的隐私数据、公司的销售数据等,绝对不能上传任何AI平台或模型。

刘哲涵他示范在没有网络连接的普通苹果电脑上运行DeekSeek,要求DeekSeek提供笑话。
自建LLM保护机密
此外,刘哲涵也提醒:
1.下载应用程式时分辨真伪
看到应用程式商店里有ChatGpt、DeepSeek就直接下载?小心,可能下载到冒牌货或携带病毒的应用程式。ChatGpt横空出世后,谷歌应用程式商店涌现多个同名但并非由OpenAI所开发的版本。
2.防范钓鱼网站
黑客可能把钓鱼网站伪装成免费的AI工具以窃取用户名、密码及个人资料。
3.下载LLM至个人电脑
倘若想提升数据安全及隐私防护等级,亦可考虑下载开源版本的大语言模型(LLM)至个人电脑。刘哲涵指出,这意味着所有的数据处理都在个人电脑上进行,不上传至任何云端(相关LLM)伺服器,也就不会被模型提供商获取,更不会在传输过程中被黑客截取。
是的!机密数据外泄可能发生在任何一个环节,并不只是限于使用AI模型,以及AI模型是否会“记住”你喂食的数据并加以泄露。比如连接免费公共WiFi时,黑客就有可能在数据传输过程中截取你的资料,上传过程其实是将数据暴露在充满不确定性的网络环境中。
尽管刘哲涵认为操作上并不难,但真正会去下载者估计只占少数,“因为他们一直以为这个很难而且很多人也不擅长。所以这不是一个技术问题,是教育问题。这个东西其实不难、它其实就是你下载后,在普通的电脑就可以运行,安全性又很高,所以大家应该去做。”
4.自建LLM
对于涉及机密资料的处理,他认为企业甚至可考虑开发或引入内部部署的LLM,这相当于建立专属的AI数据处理中心,所有数据都将在公司电脑上处理,从而大大降低泄露风险,实现更高的定制化和安全性。

AI无疑是提升效率与便利的利器,但它亦是柄双刃剑,若运用不当,潜在的风险不容忽视。(取自Elements Envato)
建大语言模式考量
1.预算
刘哲涵指出,如果企业只需处理内部数据,无需像ChatGPT那样拥有数千亿参数,只需搭建参数量较小(例如70至80亿参数)的LLM即可,成本也相对的低。
2.数据量是否充足
3.数据性质与来源
以零售业为例,由于商品价格数据例如100 Plus多少钱或二手车价格等信息通常是公开透明且可在公开网站查获。企业一般无需自建LLM,直接利用外部已有的LLM即可满足需求。
大马企业少有自建LLM
一些行业如金融、医疗、半导体、政府机构等,由于数据高度机密性、独有性且无法从公开渠道获取,自建LLM成为确保数据安全和有效分析的方法。
例如金融业处理大量客户的借贷资料,可能需要分析“多少客户借了多少钱”、“多少属于呆账”、“多少尚未偿还”并以此制定相应的策略和方法。这些都涉及高度敏感的个人财务信息;半导体公司拥有大量研究数据,均为核心的研发成果和商业机密;医疗和医药行业拥有大量病人机密数据,这些数据在网上搜索不到,必须在内部安全地处理。
“如果安全是你的首要考量,自己下载使用是最好的选择。至少在使用时你可以无需顾虑。你问了什么、想要做什么,都没有人会知道,也不会留下任何数字足迹,所有数据都只留在你的电脑里。而且这种模型是没有记忆的,它不会记住你之前问过的问题。你每次提问,它都会给出全新的回答,这是大语言模型的一大优势。这也是为什么DeepSeek问世时会震惊整个科技界,包括美国,因为它开源且可以不必上网,离线运行,非常方便。”
3原因建不成LLM
刘哲涵表示,大马企业自建LLM的情况并不普遍,甚至少于1%,主要原因在于:
1.缺乏认知:
许多公司不知道市面上有如此多适合的LLM可供选择;
2.数据收集习惯:
中小企业占全国企业的97%,普遍没有收集数据的习惯,数据量不够充足;
3.算力与人才:
企业构建LLM整个过程涉及诸多考量,包括购买哪些硬体设备、投入资金、需要聘请哪些专业人员来搭建和维护系统……等,正因为这些复杂因素,大多数公司无法立即下决定并在短时间内构建自己的LLM。
无需恐惧拥抱AI
刘哲涵认为,社会对AI普遍存在莫名恐惧或误解,这源于对其作为新兴领域的不了解,“AI真正进入大众视野也才两年左右,大家对其不了解就会害怕。”他以电动车为例,指出自动驾驶从安全性角度优于人类驾驶,但人们仍会因“无人驾驶”而感到不安。
工作需求仍存在
他鼓励企业无需恐惧反而应该拥抱AI,一旦熟悉并习惯AI,企业反而会发现没有AI“日子不好过”。在他看来,AI虽然导致部分工作被取代,但亦有可能是被取代的工作原本就不那么必要。更重要的是,工作的需求依然存在。
尽管大企业裁员新闻频传,但中小型企业却面临请不到人的窘境。例如,在新山,行政文员的薪资即使达到2000多令吉也无人问津,许多人宁愿去新加坡从事洗碗工,赚取2000多新币。AI的出现恰好可以弥补这一缺口,帮助中小企业解决运营难题,提升效率。
他在与众多中小企业接触中发现,许多企业主普遍将AI视为解药,期望通过简单学习或引入AI工具,就能一劳永逸地解决所有经营管理难题。
“他会说我先学了AI就可以解决那个问题,但是很多时候,可能有些是生意模式设计的问题,有的是人的问题,可能老板要员工不要,有些是员工很想要老板不要,所以很多这种文化上看不到的问题。”
投入心血和探索
其次,中小企业应用人工智能(AI)的主要障碍并非技术获取的难度,而是对AI“应用场景”的认知不清和选择不明。例如不清楚应该在哪些具体的业务环节、针对哪些痛点问题来部署AI,才能发挥其最大效用。这导致AI应用常停留在生成营销文案、制作宣传图片等浅显层面,远未能触及AI改造业务、提升核心竞争力的潜力。
因此,中小企业若期望将AI深度融入其运营体系,在激烈的市场竞争中脱颖而出,乃至成为行业领跑者,就必须投入更多的心血和探索。这远非简单地购买一套AI软件或升级硬件设备就能一蹴而就的事情,关键在于理解和挖掘AI的实际价值。
自动化高效完成
除了目前已广泛应用于内容创作、翻译、摘要、数据分析、报告生成,刘哲涵看好AI在商业上的下一个突破是智能体(AI Agent,又称AI代理)。
“智能体其实最主要是自动化,”例如A先生要向公司报销,就必须拍下餐厅收据、手动记录消费的餐厅、金额并进行分类,过去企业里是由会计文员来处理这类数据。有了AI助力,A先生只需拍下照片,AI就能识别出用餐地点、消费金额,并自动进行分类和记账,这即为自动化。
“在自动化过程中,有些任务是人类难以高效完成的。比如一次性查看500张收据会让人眼睛疲劳,这时AI就能代劳。这种能代替人类完成特定任务的AI,我们就称之为智能体。智能体可以专门帮你处理收据。”
应用于更复杂场景
智能体不仅限于简单的记账,还可以应用于更复杂的场景,例如审计(自动对账单和账本)、生产线监控(机器数据收集与分析)、新闻汇整并语音汇报等,“智能体在自动化里面扮演很重要的角色,自动化流程中扮演着核心大脑的角色。”
有而,对谷歌下指引或使用专属应用程式,不也可以达到同样的目的吗?他指出,智能体能够去除人类下指令的环节。例如,它可以设定在每天早上9点自动帮用户查看新闻,无需用户手动输入指令便可自动完成任务。
再比如,当客户发送邮件时,智能体可根据邮件内容进行判断:如果邮件是投诉衣服尺寸不对,它会将其转给客服部门;如果邮件是询问购买200件白色长袖T恤,它会将其发送给采购或销售部门,“这些一般上是要靠人去做的,有了智能体,智能体能够根据文字或图像进行判断,并将信息自动分发给不同的人,这也是它强大的功能之一。”