发布时间:2023-06-12
点击次数: 目录:
论文 1:Faster sorting algorithms discovered using deep reinforcement learning
摘要:「通过交换和复制移动,AlphaDev 跳过了一个步骤,以一种看似错误,但实际上是捷径的方式连接项目。」这种前所未见、违反直觉的思想不禁让人回忆起 2016 年那个春天。
七年前,AlphaGo 在围棋上击败人类世界冠军,如今 AI 又在编程上给我们上了一课。Google DeepMind CEO 哈萨比斯的两句话引爆计算机领域:「AlphaDev 发现了一种全新且更快的排序算法,我们已将其开源到主要 C++ 库中供开发人员使用。这只是 AI 提升代码效率进步的开始。」
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
推荐:AI 重写排序算法,速度快 70%:DeepMind AlphaDev 革新计算基础,每天调用万亿次的库更新了
论文 2:Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding
摘要:近期,大语言模型展现出了令人瞩目的能力。我们能否给大模型装上 “眼睛” 和 “耳朵”,让它能够理解视频,陪着用户互动呢?
从这个问题出发,达摩院的研究人员提出了 Video-LLaMA,一个具有综合视听能力大模型。Video-LLaMA 能够感知和理解视频中的视频和音频信号, 并能理解用户输入的指令,完成一系列基于音视频的复杂任务,例如音 / 视频描述,写作,问答等。目前论文,代码,交互 demo 都已开放。另外,在 Video-LLaMA 的项目主页中,该研究团队还提供了中文版本的模型,让中文用户的体验更丝滑。
下面两个例子展示了 Video-LLaMA 的视听综合感知能力,例子中的会话围绕有声视频展开。
Seede AI
AI 驱动的设计工具
713
查看详情

论文 3:Patch-based 3D Natural Scene Generation from a Single Example
摘要:北京大学陈宝权团队联合山东大学和腾讯 AI Lab 的研究人员,提出了首个基于单样例场景无需训练便可生成多样高质量三维场景的方法。

推荐:CVPR 2025 | 三维场景生成:无需任何神经网络训练,从单个样例生成多样结果。
论文 4:Spatio-temporal Diffusion Point Processes
摘要:清华电子工程系城市科学与计算研究中心最新提出时空扩散点过程,突破已有方法建模时空点过程的受限概率形式和高采样成本等缺陷,实现了灵活、高效且易于计算的时空点过程模型,可广泛用于城市自然灾害、突发事故和居民活动等时空事件的建模与预测,促进城市规划和管理的智能化发展。下表展示 DSTPP 相比已有点过程解决方案的优势。

推荐:扩散模型还能预测地震和犯罪?清华团队最新研究提出时空扩散点过程。
论文 5:SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression
摘要:为了解决准确性问题,来自华盛顿大学、苏黎世联邦理工学院等机构的研究者提出了一种新的压缩格式和量化技术 SpQR(稀疏 - 量化表征),首次实现了 LLM 跨模型尺度的近无损压缩,同时达到了与以前方法相似的压缩水平。
SpQR 通过识别和隔离异常权重来工作,这些异常权重会导致特别大的量化误差,研究者将它们以更高的精度存储,同时将所有其他权重压缩到 3-4 位,在 LLaMA 和 Falcon LLMs 中实现了不到 1% 的困惑度相对准确率损失。在单个 24GB 的消费级 GPU 上运行 33B 参数的 LLM,而不会有任何性能下降,同时还能提高 15% 的速度。下图 3 为 SpQR 的总体架构。

推荐:将 330 亿参数大模型「塞进」单个消费级 GPU,加速 15%、性能不减。
论文 6:UniControl: A Unified Diffusion Model for Controllable Visual Generation In the Wild
摘要:本文中,Salesforce AI、东北大学、斯坦福大学的研究者提出了 MOE-style Adapter 和 Task-aware HyperNet 来实现 UniControl 中的多模态条件生成能力。UniControl 在九个不同的 C2I 任务上进行训练,展示了强大的视觉生成能力和 zero-shot 泛化能力。UniControl 模型由多个预训练任务和 zero-shot 任务组成。

推荐:多模态可控图片生成统一模型来了,模型参数、推理代码全部开源。
论文 7:FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance
摘要:成本和准确性之间的平衡是决策制定的关键因素,尤其是在采用新技术时。如何有效和高效地利用 LLM 是从业者面临的关键挑战:如果任务相对简单,那么聚合来自 GPT-J (其规模比 GPT-3 小 30 倍)的多个响应可以实现与 GPT-3 类似的性能,从而实现成本和环境上的权衡。然而,在较为困难任务上,GPT-J 的性能可能会大大下降。因此,如何经济高效地使用 LLM 需要采用新的方法。
最近的一项研究尝试提出解决这一成本问题的方法,研究者通过实验表明,FrugalGPT 可以与最佳个体 LLM(例如 GPT-4) 的性能相媲美,成本降低高达 98%,或者在相同成本下将最佳个体 LLM 的准确性提高 4%。该研究讨论了三种降低成本的策略,即 prompt 适应、LLM 近似和 LLM 级联。

推荐:GPT-4 API 平替?性能媲美同时成本降低 98%,斯坦福提出 FrugalGPT,研究却惹争议。
以上就是DeepMind用AI重写排序算法;将33B大模型塞进单个消费级
GPU的详细内容,更多请关注其它相关文章!
# 清华
# seo创作网站
# 网站引擎优化推荐怎么做
# 山东靠谱seo公司
# 雷州外贸网站建设
# 邵武专业seo大概费用
# 本溪互联网营销推广公司
# 信阳网站建设大约多少钱
# 兰蔻seo建议
# 东昌府区网站seo优化排名
# 改关键词影响排名
# 实现了
# 论文
# 还能
# 多个
# 太多
# 达摩
# 提出了
# 开源
# 塞进
# 重写
# udio
# llama
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资
【澎湃原动力】人工智能产业协同创新中心:全产业链资源在这里汇聚
美图影像节演讲实录:191次提及AI,发布7款影像生产力工具
NVIDIA垄断AI市场90%份额:AMD性能追上80% 软件太不能打
标小智LOGO推出AI公司起名生成器“Name.GPT”
北京市元宇宙产业创新中心筹建工作正式启动
Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲
编程版GPT狂飙30星,AutoGPT危险了!
30+大模型齐聚,大模型成世界人工智能大会“顶流”
国内阅读行业首款对话式AI应用“阅爱聊”封闭内测
Vision Pro 太贵,苹果基于 iPhone 的 VR 头显专利曝光
生成式人工智能来了,如何保护未成年人? | 社会科学报
马斯克回应人工智能拯救世界:人类已处于“半机器人”状态
大疆 DJI Mini 4 Pro 无人机曝光:流线设计,有望迎来功能性提升
研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化
零AI含量!纯随机数学无限生成逼真3D世界火了,普林斯顿华人一作
全新小艺搭载AI大模型,有效提升学生和职场人士的工作效率
无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA
Bing Chat 和 Bing Search 正式引入深色模式
阿里大文娱CTO郑勇:生成式AI将引发内容行业巨变,*制作机会挑战并存
华为联合合作伙伴 共同发布昇腾AI大模型训推一体化解决方案
当一个网站的内容被 AI 完全接管
国内首家,360智脑通过中国信通院可信AIGC大语言模型功能评估
扎克·施奈德新片《月球叛军》曝剧照 机器人首度现身
"探索Meta发布的Quest MR/VR视频录制与拍摄指南"
央视报道!星纪魅族集团车载人机交互技术成世界移动通信大会焦点
机器人 展才能
首家承认ChatGPT影响其收入的公司Chegg选择拥抱AI ,裁减4%员工
650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了
生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型
VR健身应用《FitXR》将取消Quest 1端会员服务
元宇宙迈入2.0时代,它和生成式人工智能有何关联吗?
用AI技术点亮老照片:Deep Nostalgia带给照片新生动感
央视报道车载人机交互技术!MWC上海魅族表现亮眼,现场热火朝天
揭示经济学论文写作中提高效率与质量的AI助手应用策略
2025“春晖杯”人工智能专场对接活动举办
13万个注释神经元,5300万个突触,普林斯顿大学等发布首个完整「成年果蝇」大脑连接组
Databricks 发布大数据分析平台 Spark 用 AI 模型 SDK:一键生成 SQL 及 FySpark 语言图表代码
探展WAIC |万向区块链杜宇:不存在单一技术的iPhone时刻,Web3.0核心将基于AI+区块链+物联网
优傲机器人的人机协作技术 助力中小企发展
零数科技CTO兰春嘉:区块链与人工智能的结合点在数据
GPT-4不能在麻省理工学院获得计算机科学学位
ChatGPT会成为你家新的语音助手吗?
原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人
人工智能进入绿植界,智能庭院市场初具规模
令人震惊的特斯拉机器人
创作音乐/音频的Meta开源AI工具AudioCraft,让用户通过文本提示实现
中国气象局预测:到 2030 年,中国人工智能气象应用将达到国际领先水平
网易易盾 AI Lab 论文入选 ICASSP 2025!黑科技让语音识别越“听”越准
人工智能在商业中的风险和局限性