7 Papers&Radios|LeCun世界模型首次尝试;Meta开源文本音乐生成模型 天天热门
机器之心 & ArXiv Weekly
参与:楚航、罗若天、梅洪源
本周重要论文包括图灵奖得主 Yann LeCun 世界模型的首项研究,以及 Meta 开源的文本生成音乐模型 MusicGen。
(相关资料图)
目录:
Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture
Adversarial Example Does Good: Preventing Painting Imitation from Diffusion Models via Adversarial Examples
Disentangling Writer and Character Styles for Handwriting Generation
INSTRUCTEVAL: Towards Holistic Evaluation of Instruction-Tuned Large Language Models
Reverse Engineering Self-Supervised Learning
VideoComposer: Compositional Video Synthesis with Motion Controllability
Simple and Controllable Music Generation
ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)
论文 1:Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture
作者:Mahmoud Assran 等
论文链接:https://arxiv.org/pdf/2301.08243.pdf
摘要:让 AI 像人类一样学习和推理,这是人工智能迈向人类智能的重要一步。图灵奖得主 Yann LeCun 曾提出自监督 + 世界模型的解决方案,如今终于有了第一个实实在在的视觉模型 ——I-JEPA。如下图所示,I-JEPA 使用单个上下文块来预测源自同一图像的各种目标块的表征。
推荐:LeCun 世界模型首项研究来了:自监督视觉,像人一样学习和推理,已开源。
论文 2:Adversarial Example Does Good: Preventing Painting Imitation from Diffusion Models via Adversarial Examples
作者:Chumeng Liang 等
论文链接:https://arxiv.org/abs/2302.04578
摘要:本文介绍的是一篇收录于 ICML 2023 Oral 的论文,论文由位于上海交通大学的上海市可扩展计算与系统重点实验室、纽约大学和贝尔法斯特女王大学的华扬老师共同完成。论文的共同一作是即将攻读南加州大学博士学位的梁楚盟和上海交通大学的研究生吴晓宇。
推荐:给图片悄悄加上像素级水印:防止 AI「抄袭」艺术作品的方法找到了。
论文 3:Disentangling Writer and Character Styles for Handwriting Generation
作者:Gang Dai 等
论文链接:https://arxiv.org/abs/2303.14736
摘要:本文中,来自华南理工大学、新加坡国立大学、香港理工大学以及琶洲实验室的研究者们联合提出一种有趣的手写文字生成方法,仅需提供少量的参考样本即可临摹用户的书写风格,进而生成符合该风格的任意文字。
推荐:会模仿笔迹的 AI,为你创造专属字体,入选 CVPR 2023。
论文 4:INSTRUCTEVAL: Towards Holistic Evaluation of Instruction-Tuned Large Language Models
作者:Yew Ken Chia 等
论文链接:https://arxiv.org/abs/2306.04757
摘要:这么多年来,指令调优大语言模型的性能到底怎么样呢?本研究提出了一个全新的评估套件,对它们在解决问题、写作和对齐人类价值观等方面进行了全面评估,结果可能超乎你的预料。研究者在下表 3 中提供了开源指令模型的整体概述。
推荐:四年了,基础开源模型没有真正进步,指令调优大模型评估惊人发现。
论文 5:Reverse Engineering Self-Supervised Learning
作者:Ido Ben-Shaul 等
论文链接:https://arxiv.org/abs/2305.15614v2
摘要:自监督学习可以利用辅助任务(pretext)无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。近日,图灵奖得主 Yann LeCun 在内的多位研究者发布了一项研究,宣称对自监督学习进行了逆向工程,让我们得以了解其训练过程的内部行为。
为了直观地理解 SSL 训练,下图 1 通过 UMAP 可视化展示了网络的训练样本的嵌入空间,其中包含训练前后的情况并分了不同层级。
推荐:Yann LeCun 团队新研究成果:对自监督学习逆向工程,原来聚类是这样实现的。
论文 6:VideoComposer: Compositional Video Synthesis with Motion Controllability
作者:Xiang Wang 等
论文链接:https://arxiv.org/abs/2306.02018
摘要:在 AI 绘画领域,阿里提出的 Composer 和斯坦福提出的基于 Stable diffusion 的 ControlNet 引领了可控图像生成的理论发展。但是,业界在可控视频生成上的探索依旧处于相对空白的状态。相比于图像生成,可控的视频更加复杂,因为除了视频内容的空间的可控性之外,还需要满足时间维度的可控性。基于此,阿里巴巴和蚂蚁集团的研究团队率先做出尝试并提出了 VideoComposer,即通过组合式生成范式同时实现视频在时间和空间两个维度上的可控性。
该研究在 9 个不同的经典任务上直接测试 VideoComposer 的性能,均获得满意的结果,证明了 VideoComposer 通用性。
推荐:时间、空间可控的视频生成走进现实,阿里大模型新作 VideoComposer 火了。
论文 7:Simple and Controllable Music Generation
作者:Jade Copet 等
论文链接:https://arxiv.org/pdf/2306.05284.pdf
摘要:年初,谷歌推出了音乐生成大模型 MusicLM,效果非常不错。有人称这比大火的 ChatGPT 还重要,几乎解决了音乐生成问题。近日,Meta 也推出了自己的文本音乐生成模型 MusicGen,并且非商业用途免费使用。
如下输入周杰伦《七里香》歌词中的前两句「窗外的麻雀在电线杆上多嘴,你说这一句 很有夏天的感觉」(支持中文)。
推荐:Meta 开源文本生成音乐大模型,我们用《七里香》歌词试了下。
ArXiv Weekly Radiostation
机器之心联合由楚航、罗若天、梅洪源发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括NLP、CV、ML领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:
本周 10 篇 NLP 精选论文是:
1. Can Large Language Models Infer Causation from Correlation?. (from Bernhard Schölkopf)
2. Developing Speech Processing Pipelines for Police Accountability. (from Dan Jurafsky)
3. SqueezeLLM: Dense-and-Sparse Quantization. (from Michael W. Mahoney, Kurt Keutzer)
4. Morphosyntactic probing of multilingual BERT models. (from Noah A. Smith)
5. ChatGPT for Us: Preserving Data Privacy in ChatGPT via Dialogue Text Ambiguation to Expand Mental Health Care Delivery. (from Kai-Wei Chang, Majid Sarrafzadeh)
6. Language models are not naysayers: An analysis of language models on negation benchmarks. (from Timothy Baldwin)
7. Modality Adaption or Regularization? A Case Study on End-to-End Speech Translation. (from Jingbo Zhu)
8. Xiezhi: An Ever-Updating Benchmark for Holistic Domain Knowledge Evaluation. (from Rui Xu)
9. Word sense extension. (from Lei Yu)
10. Instruction Tuned Models are Quick Learners. (from Chitta Baral)
本周 10 篇 CV 精选论文是:
1. Multi-Modal Classifiers for Open-Vocabulary Object Detection. (from Andrew Zisserman)
2. AVIS: Autonomous Visual Information Seeking with Large Language Models. (from Kai-Wei Chang, Cordelia Schmid)
3. SMC-UDA: Structure-Modal Constraint for Unsupervised Cross-Domain Renal Segmentation. (from Rama Chellappa, Xinbo Gao)
4. Aladdin: Zero-Shot Hallucination of Stylized 3D Assets from Abstract Scene Descriptions. (from Leonidas Guibas)
5. Adding 3D Geometry Control to Diffusion Models. (from Alan Yuille)
6. Compositor: Bottom-up Clustering and Compositing for Robust Part and Object Segmentation. (from Alan Yuille)
7. Teaching AI to Teach: Leveraging Limited Human Salience Data Into Unlimited Saliency-Based Training. (from Kevin Bowyer)
8. Instant Multi-View Head Capture through Learnable Registration. (from Michael J. Black)
9. FlowFormer: A Transformer Architecture and Its Masked Cost Volume Autoencoding for Optical Flow. (from Xiaogang Wang)
10. MOFI: Learning Image Representations from Noisy Entity Annotated Images. (from Jon Shlens)
本周 10 篇 ML 精选论文是:
1. A Comprehensive Survey on Applications of Transformers for Deep Learning Tasks. (from Witold Pedrycz)
2. Inductive Linear Probing for Few-shot Node Classification. (from Huan Liu)
3. Virtual Node Tuning for Few-shot Node Classification. (from Huan Liu)
4. Understanding How Consistency Works in Federated Learning via Stage-wise Relaxed Initialization. (from Dacheng Tao)
5. Extending Kernel PCA through Dualization: Sparsity, Robustness and Fast Algorithms. (from Johan A. K. Suykens)
6. Variational Positive-incentive Noise: How Noise Benefits Models. (from Xuelong Li)
7. Privacy Preserving Bayesian Federated Learning in Heterogeneous Settings. (from Joydeep Ghosh)
8. One-for-All: Generalized LoRA for Parameter-Efficient Fine-tuning. (from Eric Xing)
9. Identification of Nonlinear Latent Hierarchical Models. (from Eric Xing)
10. Composing Efficient, Robust Tests for Policy Selection. (from Peter Stone)
标签:
推荐文章
- 7 Papers&Radios|LeCun世界模型首次尝试;Meta开源文本音乐生成模型 天天热门
- 观热点:618特写⑦|中国电商二十年 重塑618“新象限”
- 边吃席边毕业!高校把毕业典礼搬进食堂,菜单走心了……
- 天键股份:目前公司与华为没有业务往来
- 老人游颐和园遗失两万多元现金及火车票,警方紧急行动_每日关注
- ca登录未获取证书信息_ca登录 环球即时看
- “军中茅台”“部队特供”?军地联合查处所谓军酒销售门店|世界快看点
- 卫星化学最新公告:拟约257亿元投建α-烯烃综合利用高端新材料产业园项目
- 呼和浩特周六福黄金多少钱一克(2023年6月16日)_全球速讯
- 爆缸有什么预兆_爆缸什么意思 _详细_每日热门
- 中美外长会谈正式开始
- stl格式怎么转stp-stl格式
- 犀利卢汉_犀利 今日热文
- 每日报道:父亲节礼物实用送爸爸学生党_父亲节礼物实用送爸爸
- 天天观热点:【爱新疆 游家乡】炎炎夏日,带你解锁“不一样的托里”
- 环球观焦点:刚刚!泉州知名楼盘传出好消息!
- 焦点快播:“小巨人”大能量
- 火影忍者黄本孑_约会大作战h黄本|焦点速看
- 天天热推荐:曹阳路555号(关于曹阳路555号介绍)
- 肯尼迪之死未解之谜_肯尼迪之死?
- 全球快播:云视通怎么设置系统
- 每日速讯:想睡觉怎么办有什么提神的办法_夹脚拖鞋磨脚怎么办 夹脚拖鞋磨脚有什么办法
- 减肥可以吃无糖银耳羹吗_减肥可以吃无糖燕麦吗|天天新动态
- 法国面具男和t1m谁厉害(谁是法国面具男)
- 川主庙村 当前资讯
- 今日聚焦!实例:如何把PPT模板自带的动画彻底删干净?
- 东莞理工学院(东莞职业技术学院官网) 当前独家
- 全球热点!广东多个能源项目已投用 超百万千瓦规模海上风电今年并网
- 滚动:贵州毕节举行2023年就业“百日冲刺”校园招聘会
- 世界快看:一场毕业义演,也是一堂“爱的教育”课
- 石家庄市新华区2023年夏秋季征兵体检正式展开
- 18家AI头部企业、高校与科研机构联合发布首个AI框架生态倡议
- 苏州地铁11号线“保姆级”攻略!|天天最新
- 微资讯!夏天开空调一个月需要多少电费呢_夏天开空调一个月需要多少电费
- “资本活水”滋养科创企业 上海科创板上市公司IPO融资额超2000亿元-视焦点讯
- 苏州东吴今日客场挑战东莞,俱乐部发布主场变更公告
- 天天亮点!世界防治荒漠化与干旱日 | 防沙治沙的“中国智慧”
- 【世界时快讯】2023粤港澳车展:Taycan 75周年涂装版
- 焦点信息:引领中国越野皮卡进阶 2023款越野炮&火炮焕新上市
- 环球快看:崇明这里有个法治宣传晚会,你知道吗?
- 河北定州举办汉式集体婚礼 26对新人体验中国传统古礼-天天快资讯
- 三星Galaxy S21系列手机将于1月29日发布-当前播报
- 京东、淘系称“史上投入最大”,618商家怎么说|今日聚焦
- 每日速讯:中国航天突破封锁!神十七10月发射,很特殊,印日等17国参与空间站
- U17国足亚洲杯首战打平,杨晨点赞队员精神面貌
- 全球实时:部分车次车票已售罄!端午节将至,广西人出游热情高涨
- 乒坛大爆冷!男单2号种子一轮游,曾吊打梁靖崑,4-0打哭张本智和
- 气候金融创新研究中心在首届碳中和博览会上设立
- 吨标准煤单位tce(吨标准煤) 全球今日报
- 谁是电磁屏蔽膜龙头?电磁屏蔽膜价格行情走势分析(2023/6/17)
- 广西东兰:“红色工程”为党员干部“润心铸魂”
- 全球今亮点!索尼PS5预计销量超过3亿台
- 评论丨抗击通胀仍是欧央行首要目标_全球热资讯
- 【全球聚看点】充电桩下乡进行时 基础设施建设提速
- 杭州亚运会火种采集仪式在良渚古城遗址举行-报道
- 【全球快播报】法国队史射手榜:吉鲁54球第1,格列兹曼43球第3,姆巴佩39球第5
- Keria认为新版悠米难度提升,Zeus谈论上单断线发育|全球时讯
- 扬州好吃的美食团购套餐 扬州美食优选|当前视讯
- 魏晨已经抵达三亚,和于玮穿情侣装进行婚礼彩排,伴郎团备受期待-天天精选
- 18岁三个愿望全部实现!苏翊鸣:有梦就要大胆追
- 肝疼警告!iGame RTX 4060 Ti Ultra 高帧爽玩《暗黑破坏神 4》|天天滚动
- 外交部:乐见外资企业在华投资兴业 深耕中国市场-快资讯
- 安胜金融 当前独家
- 水培郁金香注意事项(家里为什么不能种郁金香)
- 伞降科尔沁草原深处_天天快报
- 冲入球场拥抱梅西的小伙,行拘!|环球滚动
- 朔州电子城星乐海滩水上乐园举行开园新闻发布会 全球短讯
- 天天简讯:上交所:本周对退市未来、退市辅仁等退市整理股票进行重点监控
- 全球球精选!安阳华润燃气积极组织参加 “全国安全宣传咨询日”活动
- 惠云钛业主要股东朝阳投资累计减持2.28%股份
- 视讯!雅安三雅图片_雅安三雅
- 市市政管理事务中心未雨绸缪 补强“薄弱点” 织牢“防护网” 全球快播报
- 焦点简讯:演唱会那些没放出来的票,都去哪儿了?
- 世界头条:5月社会消费品零售总额比上月回落5.7%
- 关于Abp Vnext 权限授权的问题
- 特斯拉变相降价8000元,Model 3价格创新低?
- 环球观速讯丨越南岘港购物必买清单
- 今日142只个股突破半年线 今亮点
- 动态:枫桥夜泊梦与房仲诸君欢饮达旦觉而怅然寄此_关于枫桥夜泊梦与房仲诸君欢饮达旦觉而怅然寄此概略
- 国特夏馨雨大胆_夏馨雨楼梯间 天天热闻
- 如何设置win10的ip地�-世界观速讯
- 6月16日 14:04分 恒生电子(600570)股价快速拉升
- 天天视点!龙吟架子工:一个响亮的劳务品牌与一个镇劳动力的就业之路
- 紫砂各种泥料的特点_紫砂泥料分类几种_环球精选
- 3分钟20cm跌停!收购案黄了,3000多股民懵了
- 济南市社会救助标识和标语征集评选结果公布
- 市场监管总局出台信用修复新规 鼓励支持相关经营主体重塑信用-环球简讯
- 精选!常德:村民用水难,消防化身“送水工”解燃眉之急
- 纪念世界防治荒漠化与干旱日学术论坛举办
- 焦点资讯:再强调一次:T恤不要配牛仔裤了,土!今年流行这样穿,洋气时髦
- 每日快看:江苏东台:滩涂变“风光渔” 绘就生态产业新画卷
- 6155视频 615
- 壳牌将在充电站领域加大投入 看好中国市场需求提升
- 这家科技巨头,又摊上大事了?! 世界最新
X 关闭
资讯
X 关闭