AI濒危语言传承避坑:文化守护成功率提升100%!
各位跨境实战精英们,你们好!
咱们今天来聊一个既有情怀又充满科技感的话题,这背后蕴藏的,可是新时代下技术与文化交融的无限可能。新媒网跨境获悉,在瞬息万变的全球市场里,懂趋势、善用工具是咱们立足的根本。今天,咱们就来看看,人工智能是如何在文化传承领域大显身手,给咱们带来哪些启发。
在美利坚合众国密歇根州的一个少数民族社群中,有位年轻人名叫丹妮尔·博耶。和她社群里许多同龄人一样,丹妮尔从小接触自己民族的语言——阿尼什纳贝语的机会并不多。
“在我们社群里,语言的代际流失速度非常快,”丹妮尔曾对外媒坦言,“我们祖父母那辈人还会说,父母那辈人会说一点点,到了我们这一代,说得就更少了。”
但这位24岁的丹妮尔,正试图用她的语言教学机器人“SkoBot”来扭转这一趋势。这款“SkoBot”的设计灵感,竟然来自一个会说话的玩偶,它被构想成一个能够与孩子们互动,帮助他们学习阿尼什纳贝语的工具。
丹妮尔的这个项目,正是当下利用机器人和人工智能技术,来保护和振兴濒危语言浪潮中的一环。尤其令人欣喜的是,这股力量往往由渴望更深入连接自身文化根基的年轻一代所推动。要知道,根据联合国的数据,平均每两周就有一种少数民族语言走向消亡,到2100年,全球一半的语言可能会消失。
造成这种现象的原因很复杂,其中包含了历史的变迁和诸多社会因素。但如今,像丹妮尔这样的技术人员、研究者,以及联合国教科文组织等机构,都在努力修复和弥补这份遗憾。
“当你失去了一种语言,你就失去了文化和生活方式中一个非常关键的组成部分,”丹妮尔在一次播客中提到,她所在的社群在疫情期间失去了许多会说这门语言的老人。“语言是我们与世界沟通的方式,也是我们讲述故事的载体。”
无独有偶,另一位来自美国加州欧文斯谷派尤特部落的杰瑞德·科尔曼,现在是洛约拉马利蒙特大学的助理教授。他最初学习计算机科学,就是希望能开发出一款类似“罗塞塔石碑”的软件,来学习自己民族的语言——欧文斯谷派尤特语。虽然他童年时学过几个单词,但由于从小不住在保留地,语言课程对他来说并不容易接触。
“我家族里最后一位能流利说这门语言的人是我的曾祖父,”杰瑞德告诉外媒,“他曾就读的寄宿学校禁止说族语,所以我的祖母就没能学到。这是我们家族语言传承的悲伤历史,也是我们部落以及许多其他部落面临的共同境况。”
AI助力,语言教学焕新生
丹妮尔与来自不同少数民族社群的两位导师合作,共同开发了SkoBot。这款机器人大小如咖啡杯,造型像林地动物,可以戴在使用者肩上,方便进行对话。当使用者说出英文单词时,SkoBot会利用人工智能语音识别技术识别词汇,并播放预先录制好的相应阿尼什纳贝语音频文件。比如,如果你对SkoBot说“hello”,它就会回应“Boozhoo”。
SkoBot项目的独特之处在于,其内置的音频文件录制了孩子们的声音,这使得SkoBot更适合在课堂上供孩子们学习语言。这个项目巧妙地结合了丹妮尔的两大热情:语言振兴和面向少数民族青年的STEM(科学、技术、工程、数学)教育。
“我们把SkoBots带进课堂,学生们亲手组装这些机器人,这真的很令人兴奋,”丹妮尔说,“他们可以设计自己的部分,接线,然后就可以和它对话了。”
而在杰瑞德·科尔曼这边,他和他的团队则运用了OpenAI公司的两款大型语言模型——GPT-3.5-turbo和GPT-4,来构建一个通过欧文斯谷派尤特语单词训练的人工智能系统。由于这些模型对其他语言的句子结构本身就有理解能力,所以能够利用这些单词构建出基本的句子。
基于这项研究,杰瑞德发布了一个在线的欧文斯谷派尤特语词典、句子生成器和翻译工具,并希望未来能继续开发更先进的语言学习工具。他强调,这些工具“首先也是最重要的”是为了帮助社群成员,同时也希望到加州该地区旅游的人们也能对学习这门语言产生兴趣。
“我们这里有很多游客来徒步、钓鱼和在猛犸山滑雪,”他说,“我希望人们能对了解他们所游玩土地上的原住民文化产生兴趣。”
AI时代下的语言保护:咱们要提前思考些啥?
新媒网跨境认为,对于从事跨境业务的精英们来说,这些案例不仅仅是故事,更是对未来趋势和潜在风险的深刻启示。一些致力于振兴社群语言的技术人员表示,他们在使用人工智能解决问题时非常谨慎,特别是考虑到少数民族社群的资源过去常常在未经补偿或同意的情况下被“提取”。
例如,丹妮尔表示,她决定在SkoBot中使用真实的、预先录制的声音,而不是AI生成的声音,因为“语言是活生生的……语言学习绝不应该只通过机器人或手机进行,它应该始终与社群成员一起发生。”她还提到,作为她和顾问团队为项目开发的伦理AI框架的一部分,那些进行录音的社群成员对这些录音拥有最终所有权。
“最基本的目标是让我们的青少年能够首先用自己的语言进行自我介绍,因为这对于……你的归属感来说非常重要,”丹妮尔说,“我非常关注的另一个方面是资料存档,确保我的语言被记录和妥善存档,但要以一种不会被非我们社群的公司剥削的方式。”
同样,杰瑞德也表示,虽然他从社群长辈的著作和录音(包括他曾祖父的)中学习,但他并未直接上传任何逐字逐句的原文来训练他的AI模型。他希望避免这些珍贵资料被AI公司以他无法控制的方式使用。
“有些录音属于不同的人……其他家庭可能对这些录音的使用有不同意见,其中一些是神圣的歌曲,一些讲述的是神圣的故事,所以我们在训练模型时非常谨慎地选择要使用的内容,”杰瑞德解释道。
他继续补充道:“我们在使用这些资料时必须非常小心,因为有些事情一旦做了就无法回头。”
此外,他们对准确性也保持着高度警惕。丹妮尔和杰瑞德都曾遇到主流AI聊天机器人对他们社群语言做出不准确反馈的情况,他们认为这可能导致对他们文化的错误理解。
“语言不仅仅是词汇,”杰瑞德说,“它承载着一个完整的文化和一段完整的历史。”
这告诉我们,在拥抱AI技术带来的便捷和效率时,尤其是在文化、内容和数据涉及敏感性时,务必注意以下几点:
- 数据权属与伦理: 谁拥有数据?如何确保数据在使用过程中不被滥用或未经授权的商业化?这对于咱们做跨境电商、处理用户数据、进行内容创作的同行来说,是必须守住的底线。
- AI的局限性与准确性: 尽管AI强大,但它在理解复杂文化语境、情感和历史深度方面仍有不足。依赖AI工具时,务必进行人工核查,特别是涉及文化差异、风俗习惯的内容,避免“翻车”。
- 技术向善与社会责任: 用技术解决问题,传承文化,这本身就是一种正能量。咱们在利用AI赋能跨境业务时,也要思考如何让技术更好地服务人类,促进社会和谐发展。
- 风险前瞻与合规性: 随着各国对数据隐私、AI伦理的法规日益完善,提前预判风险,确保所有操作都符合当地法律法规,是长久经营的基石。
希望今天的分享,能给您带来一些新的思考和启发。在未来的跨境征途中,让我们一起,用科技的力量,创造更多的价值!
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

Blink Subscription Plus Plan with monthly auto-renewal
$ 10.00

Amazon Fire TV Stick HD (newest model), free and live TV, Alexa Voice Remote, smart home controls, HD streaming
$ 24.99

Ring Battery Doorbell | Home or business security with Head-to-Toe Video, Live View with Two-Way Talk, and Motion Detection & Alerts (newest model), Satin Nickel
$ 41.24

Amazon Fire TV Stick 4K (newest model) with AI-powered Fire TV Search, Wi-Fi 6, stream over 1.8 million movies and shows, free & live TV
$ 29.99

Amazon Fire TV Stick 4K Max streaming device (newest model) with AI-powered Fire TV Search, supports Wi-Fi 6E, free & live TV without cable or satellite
$ 39.99


评论(0)