
xiejin77 发表于 2026-6-14 17:41
晨大好,关于这个问题,我正好在写关于主权AI实验室的巡礼系列,对于台湾有一段专门的论述,但这篇公号可能 ...
xiejin77 发表于 2026-6-15 07:41
晨大好,关于这个问题,我正好在写关于主权AI实验室的巡礼系列,对于台湾有一段专门的论述,但这篇公号可能 ...
料理鼠王 发表于 2026-6-14 20:58
或者说AI是鹰酱最后的遮羞布。
这个崩塌,可能意味着全球霸权的落幕。
这场突然如其来的股灾不仅瞬间蒸发近9万亿新台币(约合19000万亿人民币,或者2850亿美元)市值


xiejin77 发表于 2026-6-15 07:41
晨大好,关于这个问题,我正好在写关于主权AI实验室的巡礼系列,对于台湾有一段专门的论述,但这篇公号可能 ...
台湾的主权AI故事不是关于算力。台湾有全球最先进的芯片制造能力——台积电制造全球90%的先进AI芯片。但制造芯片和训练AI是完全不同的两件事。台积电的晶圆厂是用来制造晶体管的,不是用来刷矩阵乘法的。台湾的AI训练算力与日本处于同一量级——远低于中国和美国。
所以台湾的主权AI走的是一条语言路线。
TAIDE——Trustworthy AI Dialogue Engine——是一个由台湾国家科学及技术委员会(NSTC)牵头、联合多所大学和研究机构的跨机构计划。它的核心目标不是"做一个比ChatGPT更好的通用聊天机器人"。它的核心目标是:确保有一种AI说的是"台湾的中文"。
"台湾的中文"这个表述本身就是一种主权宣言。台湾使用的是繁体中文(正体字)。中国大陆使用的是简体中文。这两种书写系统之间的差异不只是书法。它们代表了两个完全不同的话语体系、两套历史叙事、两种文化政治。
大多数全球中文AI模型——百度的ERNIE、阿里巴巴的Qwen、智谱的GLM——是为简体中文训练和优化的。当它们被用来处理繁体中文文本时,它们会进行"繁转简"的内部转换,在简体中文的知识空间中处理查询,然后再"简转繁"输出——这是一个在字面上侵蚀语言边界的操作。
TAIDE试图逆转这个操作。它从繁体中文数据中训练——台湾的政府档案、本地新闻语料、学术出版物、社交媒体内容。它的训练数据反映了台湾的社会现实——民主制度、人权话语、公民社会。它不包含中国AI模型中被系统性地训练的"特定叙事禁区"——台湾的主权地位、天安门事件、西藏、新疆。
这是一种很激进的"价值对齐":不是微调一个已有模型来过滤掉不想要的偏见,而是从数据层面就尽量避免摄入这些偏见。
TAIDE项目有一个格外值得注意的政治特征:它在公开政治话语中的音量极低。
TAIDE的官方网站和学术论文中几乎不使用"主权AI"这个词。项目领导者很少在公开场合将TAIDE与中国AI模型进行直接对比。在受政府资助的学术会议上,研究人员用"本土语言模型"、"台湾语境训练"、"民主价值对齐"这类措辞——精准地避开了任何可能被解读为"台湾独立AI"的表述。
这并不是因为TAIDE没有政治意图——它显然有。真正的原因是,在一个中国大陆将其主权主张延伸到每一个政治符号的世界里,一个台湾政府机构直接宣布"我们正在建设台湾的主权AI"——这句话本身就可能构成外交事件。 北京可以立即将TAIDE定性为"台独AI"并可能启动一系列不可预测的外交和经济反击——从半导体供应链的压力到外交孤立。
所以TAIDE的项目领导层选择了一种精密的"语义平衡术":用技术语言来描述政治行动。他们总是在说"繁体中文的AI服务""本土文化保存""民主社会的AI需求"——但从不说"主权AI"本身。
这种沉默不是怯懦。它是台湾在不对称权力结构中求生存的一种高度复杂的战略沟通。你做的事本身就是政治——但你描述它的语言必须是技术的。因为你一旦用政治语言,你的对手就会用政治反击——而你的对手的筹码比你的重得多。
这也解释了为什么TAIDE是一个纯学术公共基金项目,而没有显眼的商业AI公司参与。学术项目有"非政治性"的外衣——尽管任何关注两岸关系的人都清楚,一个被台湾政府资助的、专门训练繁体中文和台语的AI模型,是所有"非政治"项目中政治性最强的一个。"非政治"本身就是台湾最有效的政治姿态。
TAIDE的目标不止于繁体中文。它正在扩展台湾的本土和乡土语言:台湾闽南语(台语)——一种在台湾有大量口语使用者但在数字文本中存量极少的汉藏语系语言。客家话——台湾第三大语言社区。16种被政府承认的南岛语系原住民族语言——包括阿美语、泰雅语、排湾语、布农语等,其中每一种的母语者都在数万到数十万之间。
对于这些语言,AI不是一种"便利"——是一种生存。一个永远不能用自己的母语与电脑互动的社区,其语言在数字时代的生存几率停留在口头传统上的几代人。AI提供了前所未有的"语言保存"机会——因为你可以在训练集中注入所有已知的这种语言的文本和语音记录,让一个模型永久地学会说这种语言。
但这也是TAIDE最脆弱的一层。小语种的训练数据极其有限——不是百万级网页,不是万本书籍,是几百小时的录音和几千页的文字记录。用这么少的数据训练一个有意义的语言模型,本身就是AI领域最困难的研究挑战之一。台湾的研究者正在尝试用迁移学习、数据增强和跨语言预训练来弥补这些缺口——但缺口是真实存在的。
TAIDE项目中有一个被公众讨论得最少的维度,但它可能是整个计划中最具政治战略意义的部分:防污染设计。
当一个台湾开发者基于Qwen或ERNIE进行微调时——即使只使用了他们的模型权重——底层的"世界知识"仍然是中国互联网的产物。这些模型被训练为"不在特定话题上产生不符合中国法律的内容"。而中国法律关于台湾的立场——"台湾是中国领土不可分割的一部分"——是这些模型底层训练数据中不可移除的政治前提。
TAIDE从数据层面切断了这个依赖链。它的训练管道只使用台湾来源的数据——台湾的院校刊物、台湾的媒体档案、台湾的政府出版物、台湾的社交媒体内容。它不是事后过滤,而是更早一步:从一开始就不摄入那些偏见可能存在的数据源。
但"防污染"有一个悖论。TAIDE的目标之一是让模型能够"自由地讨论所有话题,不进行自我审查"。但一个完全不进行任何内容边界设定的AI——在台湾的民主语境中——仍然需要面对仇恨言论、虚假信息、国家安全敏感话题等治理挑战。"不审查"不等于"无规则"。而规则的设计——在自由的边界和滥用的危险之间划出红线——是各国主权AI都在挣扎但台湾的语境尤为敏感的问题。
TAIDE运行在一种高度紧绷的地缘政治张力上。
在一端,台湾拥有台积电——地球上最重要的AI芯片制造设施。没有台积电的3纳米和4纳米工艺,NVIDIA的Blackwell GPU就不会存在。Jensen Huang将台积电描述为"地球上最重要的公司"——这不是夸张。这是对全球AI供应链脆弱性的最权威表述。
在另一端,台湾自身的AI训练算力极其有限。台湾国家高性能计算中心(NCHC)提供了Taiwania系列超级计算机,但这些系统的AI算力仍然远低于训练一个前沿大模型所需的规模。TAIDE的训练需要在台湾的有限本地资源和海外云服务的配合上达成平衡——而这又引入了潜在的依赖链问题。
"算力即国力"——这句话在台湾被政府官员和产业领袖反复引用。在这个维度上,台湾的"国力"是全球最强的之一——因为它制造了训练全球AI所需的几乎所有先进芯片。但这种国力不能直接转化为"训练台湾自己的AI模型"的能力。台积电不卖芯片给台湾政府用来训练TAIDE。台积电卖芯片给NVIDIA——然后台湾政府再从全球市场上买回由台积电代工的GPU。在这个循环中,台湾的半导体霸权是一种"间接主权":它不直接为台湾AI提供算力,但它让全世界对台湾的持续稳定运转产生了无法摆脱的依赖。
当某个国家的主权AI需要用NVIDIA GPU运行时,这台GPU在物理上是由TSMC的Fab 18生产的。当那个国家质疑台湾的主权地位时,它用来运行政策的AI推理服务器里的芯片上,刻着的是台湾新竹的地址。
台湾主权AI最底层、也最少被直接说出的博弈在这里:你用我的芯片来定义你——但如果没有我的芯片,你根本接触不到那个定义的原材料。
台湾在主权AI版图中的位置有一个深沉的悖论。
台湾训练TAIDE的算力是有限的——它需要依赖美国云服务商,有时甚至需要通过NVIDIA的H100 GPU从海外获取。台湾本地的AI超级计算基础设施规模不大。
但在地球另一端的台湾新竹科学园区里,台积电的Fab 18——全球最先进的芯片制造工厂——正在量产着为训练AI模型而设计的3纳米和4纳米GPU芯片。这些芯片——每一块上都刻着台积电"台湾制造"的标记——被装箱运往HPE、Dell、Supermicro的服务器组装线,然后安装在硅谷、西雅图、北京、深圳的数据中心里。
台湾制造了全世界训练AI的芯片——但它用来训练自己主权AI的算力,可能还不到它制造出来的总AI算力的千分之一。 这是一个关于全球半导体分工的戏剧性错位:产能最大的一方,消费最小的一方。
"算力即国力"——这句话在台湾被政府官员和产业领袖反复引用。在这个维度上,台湾的"国力"是全球最强的之一。但这种国力不能直接转化为"训练台湾自己的AI模型"的能力——因为台积电不卖芯片给台湾政府用来训练TAIDE。台积电卖芯片给NVIDIA和AMD——然后台湾政府再从全球市场上买回由台积电代工的GPU。
在这个循环中,台湾的半导体霸权是一种"间接主权":它不直接为台湾AI提供算力,但它让全世界——包括美国、中国、欧盟——对台湾的持续稳定运转产生了无法摆脱的依赖。当NVIDIA的CEO Jensen Huang反复说"台积电是地球上最重要的公司"时,他不是在夸赞——他是在承认一个事实:全球AI训练芯片的物理生产,集中在一个只有2400万人的岛屿上。
台湾的主权AI不靠自己训练最强模型来证明存在,而是通过制造所有人训练模型所需的芯片,把自己嵌进全球AI系统的最底层。
| 欢迎光临 爱吱声 (http://www.aswetalk.net/bbs/) | Powered by Discuz! X3.2 |