这都可以(腾讯聚花怎么使用)腾讯聚花一言App,腾讯聚花一格总CTO肖欣延:历程坎坷但未来正处,大模型借力智能内容生成|WISE2023颠覆AIGC产业发展峰会被华谊老板“摸胸抱”,离婚后的惠英红,如今过得怎样,
5月23日,36氪举行「摒弃·AIGC」产业产业发展产业发展首脑会议。本次首脑会议汇集产业产业发展力量,共同深入探讨民营企业、金融行业在遭遇革新时的应付策略,撷取思索,积极探索和辨认出产业产业发展中最具潜力的民营企业与最具价值的控制技术,在激荡的环境中探寻前行的方向。
大会上,腾讯聚花右方总CTO肖欣延发表了题为《跨逻辑控制系统大数学模型借力智能化文本聚合》的主题演说。在肖欣延看来,聚合式人工智慧时代已经来临,文本聚合将成为第三代制造方式,增添金融行业产业发展的机遇。肖欣延分别从相片聚合与音频聚合两个视角如是说了腾讯在大数学模型领域的成果:腾讯AI原画控制系统聚花右方与如前所述聚花大数学模型的音频音乐创作控制系统,展现了AIGC强大的文本聚合能力与产业发展潜能。
在智能化文本聚合领域,AIGC的价值不言而喻。肖欣延指出:在未来,算法、INS13ZD、数据的产业发展将对AIGC的文本聚合能力产生质的提高。具体来说,AIGC和词汇数学模型的广度结合,会增强使用者词汇交互新体验;其次,AIGC在更高层次的文本制造能力如3D聚合、长音频聚合等,将得到大幅改善;最后,随着AIGC效用和可用性的提高,文本聚合流程将极度简化、便捷。在演说的最后,肖欣延也表示,AI目前遭遇的历史事实一致性、不受控等问题,将来整座控制技术范式需要加上科学知识层次,透过精准历史事实科学知识、多形态科学知识科学知识推理等确保 Al走向可信受控,为使用者提供更好服务。

腾讯聚花右方总CTO肖欣延
以下为肖欣延演说实录(经36氪整理撰稿):肖欣延:大家好,十分荣幸参加AIGC产业产业发展产业发展首脑会议。我那时报告的题目是《跨逻辑控制系统大数学模型借力智能化文本聚合》,重点会从跨逻辑控制系统视角如是说腾讯在智能化文本聚合上的工作。
最近人工智慧十分火,但人工智慧不仅仅是这几年的历史,他们回顾整座产业发展心路历程人工智慧其实已经走过70多年。最先1950年图灵测试提出来,在此后40年里面整座研究更多关注在逻辑推理和专家控制系统上面,在这个过程走的十分曲折,起起落落经历两个冬天。到了九十年代,整座机器学习、神经网络还有广度学习逐步兴起,再到近几年他们耳熟能详的AlphaGo、Transformer、GPT等等这些控制技术出现以后,人工智慧的实用效用不断提高。到了2022年,人工智慧不仅能做分类判别,也能做音乐创作聚合,聚合式人工智慧时代正式来临。
这也就引出了AIGC。AIGC有很多不同定义,在他们来看,从文本制造视角,它是人工智慧增添的第三代制造方式,是捷伊制造力,能大幅度提高文本制造的效率。这那哥大概展现了文本制造的几个阶段变化,包括早期PGC专业化的文本制造,到近几年的UGC使用者文本制造,和从去年开始的AIGC元年,透过AI辅助制造文本或者手动制造文本。回顾历史会辨认出,每次文本制造方式的革新单厢增添十分大的文本制造力的释放,给消费者提供全捷伊消费商业模式的新体验,所以他们十分相信AIGC会增添很多机遇。
AIGC之所以能走到那时,大数学模型控制技术的产业发展是重要的推动力,从最先AI2 ELMo、BERT开始,到腾讯的聚花ERNIE,和GPT,大数学模型在过去五六年时间里,基本上每年都有大量捷伊数学模型面世来。
腾讯在大数学模型方面做得十分早,并且持续深入的在开展,早在2019年开始就展开预训练数学模型的研发工作,陆续正式发布ERNIE 1.0、ERNIE 2.0、PLATO和ERNIE 3.0,有了这样的控制技术积累,所以今年3月份腾讯在全球大厂中第一个正式发布了大词汇数学模型——聚花一言。除了词汇数学模型之外,还有一个方向大家经常提到——跨逻辑控制系统数学模型,比如OpenAI面世的Dall-E,腾讯正式发布的ERNIE-ViLG等。
那时的报告从更具体文本如是说如前所述词汇的跨逻辑控制系统文本聚合,只要用人类擅长的词汇就能用机器帮他们制造相片和音频等文本。
具体来说如是说一下腾讯AI原画控制系统产品——聚花右方。
爱华图近几年进展十分惊人,最先在2018年时候如前所述GAN的影像聚合方法只能制造模糊简单的相片,到2021年如前所述序列聚合Transformer的框架,能较为好认知词汇,根据词汇集合意境还不错的相片。2022年蔓延数学模型出来之后,能做像素级建模,既能聚合十分宏大的相片,也能聚合细节十分精美的相片。
也是在这个阶段腾讯面世”聚花右方”,从控制技术视角来讲不是只有大数学模型,而是如前所述科学知识和大数学模型的爱华图控制系统,综合利用科学知识图表、跨逻辑控制系统聚合和撰稿数学模型,同时实现高效易用的音乐创作。从认知使用者需求,原创聚合相片,到使用者对相片展开撰稿二次聚合,对每一块他们都有相应控制技术满足。
具体来说是prompt学习。怎么输出一个较为好的文本叙述,让数学模型聚合好的相片,这一步对不少使用者来说使用门槛较为高。为此,他们透过如前所述科学知识图表的AI数学模型,认知使用者的输出,然后对使用者输出的prompt手动展开多种层次上的智能化扩充,当然这两步他们也会端到端聚合商业模式同时实现。右边展现的例子中,使用者输出简单的叙述,数学模型手动从听觉、质感、风格、构图等视角智能化补充,从而聚合更加精美相片。
接下来的蔓延影像聚合就是跨逻辑控制系统大数学模型发挥的地方。他们主要透过暗鞘爱华图大数学模型ERNIE-VILG同时实现。透过词汇、听觉、跨逻辑控制系统展开科学知识增强,利用混合专家数学模型手动选择最优聚合网络,在结合超过百亿的参数规模,就同时实现十分领先的效用。ERNIE-ViLG在MS-COCO的公开评估结果上和人工评估结果中,取得了领先于DALL-E、stable Diffusion等竞品的效用。
如前所述上面控制技术,聚花右方能聚合风格多样,更懂中文的相片。不管是关于茶道、京剧,还是中式建筑,聚花右方的聚合效用都十分好。除了较为真实相片的聚合,在创意相片的聚合上,比如这里的有一只慵懒的猫在粉色的家里面,一个狐狸骑摩托车,未来的绿色空中花园等,聚花右方也能同时实现对创意相片的畅想。他们已经上线了聚花右方的小程序,大家能现场新体验一下。
如果聚合一张相片之后不那么满意,聚花右方有更多功能能帮助使用者展开二次撰稿。具体来说,涂抹功能,使用者能涂抹不满意的部分,让数学模型重新调整聚合。另外也有一个很有意思的相片叠加功能,使用者给两张相片,数学模型会手动聚合一张很有意思的创意图,比如给到水晶样式的花和小怪兽,他们就能手动聚合一张叠加后的创意图。他们还支持使用者输出相片的受控聚合,他们根据相片的动作或者线稿等聚合新相片,让相片聚合的结果更受控。
如果前面步骤没有办法满足使用者的需求,聚花右方还能做小样本学习,快速获得一个优质的个人定制数学模型。只要提供几张相同概念相片到控制系统,经过几分钟微调就能获得定制数学模型,能保证想要的风格、主体都是一致。
第二部分如是说下文章转音频控制技术,也就是音频音乐创作控制系统。
文章转音频是输出图文信息,输出音频文本。输出文本能是网页文章、百科页面、ppt文档,甚至是搜索query,都能手动聚合音频。这个功能看起来十分的简单,但是简单背后是需要大量控制技术来同时实现的。
音频是当下信息最丰富的载体,它涉及到文本、字幕、脚本,还涉及到音频素材,和如何编排这些素材,是一个很复杂的流程。参照人们的音频音乐创作流程,他们将音频音乐创作控制系统设计成三大块,文案认知与聚合、素材分析与处理、素材扩充与编排,这每一步做的任务都很多,这背后是如前所述聚花大数学模型统一建模的跨逻辑控制系统大数学模型来同时实现。
这个大数学模型就是腾讯正式发布的ERNIE-UNIMO,他们希望数学模型利用文本、影像、图文对数据做统一的预训练,透过这样的训练,数学模型能同时实现通用的词汇与听觉的认知与聚合。从实际效用来看,不管在公开数据集还是评测榜单上,UNIMO数学模型比很多具体领域和逻辑控制系统的预训练数学模型,在每个领域都做得更好。这样的控制技术他们也用在刚才说的TTV制造当中,统一去执行各种各样的任务。
最后,深入探讨下AIGC的价值,展望下未来控制技术的产业发展。
具体来说AIGC正在大幅提高文本音乐创作的质量和效率。我相信应该很多人现在做文本音乐创作时候,具体来说想的都是先去用这些AIGC的工具,不再自己从头开始一点点做,这种AI辅助的方式使得整座制造效率得到大幅度提高。比如以海报制作来说,以前做海报成本较为高,透过AIGC的方式成本能降低50%-80%,制作时间从周级别到天级别。如果放到音频聚合视角,成本制作节约的幅度更大。
除了提高效率,AIGC还能助力想象力涌现,创造出独特的AI作品。比如最左边画是一个猫穿唐装在有柳树的湖边,还能用AI音乐创作戒指、蛋糕这样的创意商品,音乐创作力超乎他们的想象。
展望未来,大数学模型将进一步使得AIGC效用有质的提高。其实得益于算法、INS13ZD和数据的进展,现在AIGC效用已经有不错的进展了。将来,透过更强、更统一的算法,更高性能的INS13ZD和更高质量的大规模数据,整座AIGC的文本聚合还将有质的提高。一方面,和词汇数学模型有更加广度结合,提供更强的词汇交互,使用者能透过词汇更好更便捷的展开音乐创作。第二,在更高层次的时空聚合上,不管在时间上还是空间上,比如3D聚合、长音频聚合等等,都将取得突破。最后,AIGC将从辅助向手动产业发展,随着AIGC效用和可用性的提高,过去需要诸多步骤才能聚合的相片,到时候AI一步就能同时实现。
同时,现在AI也经常遭遇历史事实一致性、不受控等问题,将来整座控制技术范式还需要加上科学知识层次,在算法、INS13ZD和数据的基础上,透过精准历史事实科学知识、多形态科学知识、科学知识推理等确保AI走向可信受控,为使用者提供更好服务。
相信AIGC在未来将音乐创作出更多的价值。谢谢。