海军2台直升机碰撞坠机!当局公布10名死者名单点看最新消息
星洲网
星洲网
星洲网 登录
我的股票|星洲网 我的股票
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

OpenAI

最近,YouTube首席执行员尼尔·莫汉(Neal Mohan)接受Bloomberg Originals采访时说,如果OpenAI用YouTube视频训练Sora,将会违反YouTube平台的服务条款。 Sora是OpenAI旗下一款文生视频大模型,只要输入指令,便可以生成长达1分钟的视频。由于视频太过逼真,许多人想知道OpenAI的训练素材来源。 在今年3月份,《华尔街日报》记者便向OpenAI的首席技术官米拉·穆拉蒂(Mira Murati)抛问,希望能解答大众疑虑。然而,当问到OpenAI有没有用YouTube、脸书、Instagram的视频来训练Sora,她语焉不详,表示不清楚Sora的训练素材来源。作为首席技术官,这个回答令人很惊讶。 谷歌用YouTube视频训练Gemini 几个星期后,彭博社旗下的“Bloomberg Originals”与尼尔·莫汉进行采访。在采访过程中,对方坦言自己也不清楚OpenAI是否有用YouTube视频来训练Sora。如果真的有,那么肯定违反了YouTube平台的服务条款。 记者接着询问,谷歌会不会用YouTube内容来训练大语言模型“Gemini”?他答,谷歌确实有用一些YouTube视频来训练“Gemini”,但前提是创作者在上传视频到YouTube时已经有授权同意。 未来数据版权纠纷会更多 在未来,这些AI大模型会更渴望数据。因为数据越多,它的性能就越好。但如果没有明确的AI版权法案,接下来会陆续发生各种数据版权纠纷。 根据《纽约时报》4月6日的报道,OpenAI曾开发一款语音识别工具“Whisper”,将超过100万小时的YouTube视频转录成文本,作为大语言模型GPT-4的训练素材,让它变得更加智能。理论上,这个举动已经犯了视频版权,因为这些都是属于创作者的视频。 除了视频语音,OpenAI也用新闻文章来训练AI工具。《纽约时报》曾在2023年状告OpenAI和微软侵权,在未经许可的情况下,使用受版权保护的新闻文章来训练他们的AI聊天机器人。然而,这两家科技公司称,他们是依据“合理使用”的法律原则来训练AI工具。
22小时前
2星期前
3星期前
3星期前
3星期前
3星期前
3星期前
3星期前
【AI文学实验】 当文学创作遇上AI热潮,不愿束手就擒的写作人会怎么做呢?创意本就是创作者的看家本领,不妨趁势想想,在看图作文,或是以文制图之外,还有什么交错的路。本期且先看作家棋子的一场文学实验。 或许也可想想神笔马良的童话。少年马良偶然得到一支神笔,画什么,什么就会活起来。用今天的眼睛看,那活起来的生物,到底该算马良之功,还是笔的魔力?(编辑无解,同好努力) 〈新墙〉 他心里有一隅,只有黑暗才能填满。于是他喜欢夜行,在光不及之处,狩猎一样能量的人。而这股能量如果契合且碰出火花,所产生的愉悦比做神仙还快乐。 至此,心里那狭小旮旯再也不能满足他。他扩建墙,遮住阳光,让暗巷角落越来越大,让黑魆魆的人影越来越多。 某天,按新加坡人力部要求客工例行体检之前,他先在别处做了匿名验血。 他膜拜顶礼向光合十,但光徘徊在墙外。 24小时之内向公司提交辞呈,老板同事都觉得不可思议。他只敷衍说家里发生紧急事故,母亲突然中风需马上回国全心照料。仓促告别,没有人知道他验血的事。 回到自己的国土,他庆幸逃过禁止入境新国的黑名单,但那面墙,总在夜里不断搭砌,逐块将他包围。 〈可怜的番茄〉 父母无意间发现儿子和邻居阿城偷偷约会,要他们回家说个明白。 他们战战兢兢地进门,只见父母在客厅正襟危坐,茶几上置放了一颗熟透的小番茄。 父亲不发一语,张开手掌往番茄拍打下去,砰地一声吓坏了他们。 父亲笑说:“压抑会烂掉你们的人生。” “爸妈,你们这是干什么?我是和阿城今晚约了隔壁班的女孩去看电影。” 〈最后的早餐〉 克里斯带他到附近的一间小餐厅。餐厅装潢简约,餐桌铺上红白格子桌布,配以一瓶小花,乡土风味浓郁。 克里斯点了非常道地又丰盛的早餐,有三明治、奶油面包、烤番茄、煎蛋、茄汁豆、香肠、培根等等。 他对克里斯说不要点太多,吃不完会浪费。克里斯说一定要吃完才可以抵挡风寒。 边吃边聊些气候变迁与近况,弥漫着祥和拘谨的氛围。 餐后,克里斯拿出手机,问之前我们视讯时,手机是否会自动美颜? 他答或多或少会吧。 克里斯睁大眼,把手机摆在餐桌,默默喝着红茶。 〈戒〉 时间能淡逝浓情吗?也许。 某天午后,我去看那片两个人的海。海浪没有当时那般汹涌;白云慵懒躺在天的怀抱,小船情系大海随波荡漾。一切多么和谐,岂可伤悲? 我相信我能不爱了,不爱了。就这样吧,那一页分手信,我将它扔进海里,随浪消逝。 后来,在一个应酬的酒会上,他们谈起了戒。甲说他有三高,但是戒不了酒;乙附议,戒烟就会要了他的命;丙大言不惭,戒了烟酒和高脂肪食物,生命还有什么意义?况且,他的奶奶抽烟还可以活到100岁。 我没说什么,只要受得住伤痛,戒不戒是很个人的事。 〈系梦人〉 志贤怀着三个梦,决心去找解梦人。 解梦人的家,夹在纷扰的城中。按了门铃,解梦人出来迎接。走进庭院,杂树丛生。她说不喜欢盆栽,喜欢栽种竹,羊齿植物,和一些不知名的野树。没有规格的栽植,野野的让它们自由发展,还笑说这是城中仅有的一片森林。 梦也是杂乱无章的,志贤好不容易笔录梦醒后的残影,递给她解。 她仔细翻阅:“三个梦都有一个共同点:你拿起电话听筒,梦就醒了。” 志贤点点头,那又是代表些什么呢? “你还有些话来不及跟他说。” 志贤泪洒当场。 他感觉到有一股很大的能量,紧紧地,暖暖地,将他环抱;记得那夜,爱人在飞机失事前,打了很多通电话,志贤没接到。 而他藏在衣柜里的求婚戒,永远藏着。 〈洗脸〉 帮岚姐洗脸的那位小妹,说话有点失礼:你几岁了,结婚了没,有小孩吗? 纤细的手往脸部搓揉,两颊滚动着洁面乳。岚姐不以为意:35岁单身没小孩。 可小妹那张嘴,还真是不会停:你的皮肤很干,要加保湿面膜吗?有试过我们的产品吗?成分有玻尿酸等等。岚姐忙说不用了,朋友从台湾带来好多面膜,还没用完。 小妹又说,最近是不是睡不好,你的脸有很多毒素。我们公司研发了刮痧排毒疗法──它是一支棒,刮脸部穴位,保证你看到效果。猜猜多少钱?原价400多,现在只需98。 岚姐厌烦极了,本想叫她住嘴,但又不忍心,淡淡回应下回再考虑。只是这样的答案,并不能满足小妹;她说活到这把年纪了,单身又没小孩,金钱应该不是问题,健康的容貌才是重要的啊。 什么叫活到这把年纪了?口无遮拦该生气吗,深深吸气笑了几声,算了,真希望洗脸的是一台不会说话又没有灵性的机器。 洗完脸,到柜台付账,只见老板摆着臭脸。 仿佛说:如果你不生气,生气的就是我。 *作者备注:微软产品Bing Image Creator采用OpenAI提供的DALL.E模型,用户只需使用文字描述,即可生成相应的图像。在此,只是记录科技与生活的演进阶段,不存在任何批判。 相关文章: 棋子/此身无聊 棋子/一行小说 棋子/乌鸦飞过上空
4星期前
1月前
1月前
1月前
大家近期都把焦点专注在文本转视频功能,尤其OpenAI的“Sora”和谷歌的“Lumiere”。亚马逊则另辟方向,推出了一个全新的文字转语音模型“BASE TTS”,而最大亮点是该模型能够依照文本对白,表现出各种句子的“情绪”和语气。 “BASE TTS”全称是“Big Adaptive Streamable TTS with Emergent abilities”,它一共有3种数据集版本,最大的版本是“BASE-large”,拥有9.8亿个参数,并采用了来自公共网站的10万个小时语音数据来训练。另外两个版本的规模较小,分别是“BASE-small”和“BASE-medium”。前者拥有1.5亿个参数,用了1000个小时的语音数据来训练;后者有4亿个参数,用了1万个小时的语音数据来训练。 语音数据保留嘈杂的环境音 亚马逊称,整个语音数据集以英语为主(超过90%),其次是德语、荷兰语和西班牙语。这些语音数据都不是在录音室录制的“干净”声音,大多数有嘈杂的环境音。为了测试模型的能力,他们没有为语音做任何降噪或剪辑,看看这个模型能不能生成清晰的语音。 为了加强“BASE TTS”理解文本的能力,亚马逊还动手创建了一个“新兴能力测试集”,一共有7个项目,比如问题、情感、复合名词、外来词汇、句法复杂性、副语言学(Paralinguistics)和标点符号。“我们的假设随着增加‘BASE TTS’的模型容量和训练数据,模型将开始获得这些(解读)能力。” 在整个测试过程,他们发现模型参数和数据多寡会影响“BASE TTS”的能力。例如“BASE-small”是无法解释情感、语音、语调和外语词汇。相比之下,“BASE-medium”模型没问题,还能进一步掌握复合名词。“从‘BASE-small’到‘BASE-medium’,语音的自然程度明显提高了。但是从‘BASE-medium’到‘BASE-large’,提升程度较小。” “我们相信,把基于GPT的TTS模型训练时间从1000小时扩展到1万小时,然后再将模型参数从1亿增加到5亿,会让我们的TTS开始出现‘新兴能力’(emergent abilities)的转折点。” 亚马逊有将这些AI声音上传到网页(https://www.amazon.science/base-tts-samples/),而当我聆听时,真的很难辨别声音真伪。目前,这个模型还在实验阶段,亚马逊担心这种能力很可能被滥用,所以决定不公开这个模型的源代码。 相关文章: AIA引进AI面试 寻找合适人才变得容易? 谷歌生成视频把名画搞笑了 抖音测“AI搜” 想打搜索引擎主意? AI工具太方便 “内容农场”8个月内膨胀12倍 AI新闻女王登场 24/7资讯不间断
1月前
2月前
2月前