欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的平常指南。在这儿,咱们每日从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.7.5省流概览
-李彦宏:开源模型是智商税,智能体正在爆发
-MySQL 9.0 “创新版” 已支持向量
-Java 工程师的 Python 指南
-Windows 下的 GUI 研发
-用 150 行 C 代码超越 NumPy 的矩阵乘法性能
-边学 AI 边挣钱的 GitHub 项目
-有趣的人形设备人争相登场
-上海 AI lab 开源多模态 LLM
今日要闻
李彦宏:开源模型是智商税,智能体正在爆发
李彦宏认为,开源其实是一种智商税。“当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发掘,你永远应该选取闭源模型。今天无论是 ChatGPT、还是文心一言等闭源模型,必定比开源模型更强大,推理成本更低。”
谈及 “AI 超级应用什么时候显现” 时,李彦宏暗示,“不是说必定在等待一个超级应用的显现”。他认为,在基本模型之上,应该能够诞生数以百万计的各样各样的应用。“倘若仅仅是从 0 到 1,你可能会期盼显现某几个 Super APP,亦便是几个机构从中受益。然则今天,几乎各行各业所有的机构,被大模型加持之后,它都能受益。这种影响力,针对全部社会、针对人类来讲,无疑是更大的。”
李彦宏叫作,智能体表率着 AI 时代的将来趋势。“智能体正在爆发,只是此刻基数还比较小,大众的体感无那样剧烈。” 基本模型需要靠应用才可显现出价值,智能体是一个几乎 “放之四海而皆准” 的基于大模型的应用,因为它门槛足够低,可能你连编程都不消,就能够做出一个效果不错的智能体。“让更加多人进来,她们发挥聪明才智,指不定哪条路跑通了,它便是一个 Super APP。”
MySQL 9.0 “创新版” 已支持向量,为么甲骨文却 “偷偷摸摸” 地宣布?
针对 MySQL 9.0 “创新版”,最值得关注的新特性莫过于支持向量数据类型,字段类型名叫作为VECTOR,能够运用
to_vector/string_to_vector/from_vector/vector_dim 等函数操作向量数据。
下面示例是运用 CREATE TABLE 创建包括 VECTOR 列的 InnoDB 表:
mysql> CREATETABLEv1(c1 VECTOR(5000));
QueryOK, 0rowsaffected(0.03sec)
操作向量的关联函数介绍: VECTOR_DIM函数用于获取向量的长度
STRING_TO_VECTOR(别名TO_VECTOR)函数采用向量的列表格式暗示形式,并返回二进制字符串暗示形式
VECTOR_TO_STRING(别名FROM_VECTOR)函数执行和上面相反的操作通义真正实现全尺寸、全模态开源,下载量已破 2000 万
在今日的 2024 上海世界人工智能大会上,阿里云 CTO 周靖人颁布近期通义大模型和阿里云百炼平台的最新发展:近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次;阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。
周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,咱们在世界人工智能大会上发布通义大模型系列,当时咱们颁布,通义核心模型将开源开放。到今天,通义千问已然实现真正道理上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”
腾讯混元 DiT 开源 6G 小显存版本,支持 Kohya 训练
腾讯混元文生图大模型(混元 DiT)宣布开源小显存版本,仅需 6G 显存就可运行,对运用个人电脑本地安排的研发者非常友好,该版本与 LoRA、ControlNet 等插件,都已适配至 Diffusers 库;并新增对 Kohya 图形化界面的支持,让研发者能够低门槛地训练个性化 LoRA 模型;同期,混元 DiT 模型升级至 1.2 版本,在照片质感与构图方面均有所提高。
另外,腾讯宣布混元文生图打标模型” 混元 Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮忙研发者快速制作高质量的文生图数据集。
今日观察社交观察
《Java 工程师的 Python 指南》
作者是一名前端工程师,受人工智能的影响,决定系统性地学习 Ptyhon,并将其学习过程整理成这本书。
涵盖了从 Python 环境安装到项目研发的方方面面,同期会经过案例对比 Java 和 Python 语言的异同,帮忙 Java 工程师快速把握 Python 语言。
GitHub:
github.com/luckrnx09/python-guide-for-java-engineers
- 博客GitHubDaily
用 150 行 C 代码超越 NumPy 的矩阵乘法性能
“这篇博文是我尝试在 CPU 上实现高性能矩阵乘法的结果,同期保持代码简单、可移植和可扩展。该实现遵循 BLIS 设计,适用于任意矩阵大小,并且在针对 AMD Ryzen 7700(8 核)进行微调后,性能超过了 NumPy(=OpenBLAS),在各样矩阵体积上实现超过 1 TFLOPS 的峰值性能”。
文案位置:
salykova.github.io/matmul-cpu
- 博客蚁工厂
Windows 下的 GUI 研发
研发 Windows GUI 应用真是让人头疼,先梳理一下需要:
- 仅支持 Windows
- 准许商场用途
- 易于样式化,包含暗模式
- 结果是一个无依赖或最小依赖的单一.exe 文件,体积不超过 40MB
- 编写 GUI 部分不该比实质功能花费更加多时间
然而日前市面上的平常库体验并欠好:
1. WinUI 3:支持现代 Windows 组件和样式化,但分发时依赖繁多,难以实现单一可执行文件。
2. Win32 / MFC:高可移植性,但样式化困难,需要海量自定义绘制代码。
3. Qt:功能强大,易于样式化,但动态链接依赖大,静态链接需开源或购买商场许可证。
4. wxWidgets:学习曲线平缓,可静态链接成小文件,但样式化受限。
5. hikogui:新兴库,运用 Vulkan 后台,样式化方便,但编译繁杂且稳定性差。
6. Sciter:类似 Electron,支持 HTML/CSS 写 GUI,但渲染效果通常,某些元素没法自定义。
7. WinForms / WPF:意见运用其他前端技术并加载 C++ 功能模块,理论上可实现单一可执行文件,但依然有些繁杂。
经太多方尝试,发掘 Dear ImGui 最适合简单的应用。虽然设计繁杂 UI 时有些局限,但符合大部分需要。ImGui 是即时模式 UI,需要运用 DirectX 进行渲染,但其结果仅有 500KB 体积,不需要额外安装任何依赖。
- 博客量子位
上海 AI lab 开源多模态 LLM:InternLM-XComposer-2.5
仔细的模型特点:
长上下文处理:IXC-2.5 原生支持 24K 标记的输入,可扩展到 96K, 能处理超长文本和图像输入。
多样化视觉能力:支持超高分辨率图像理解、细粒度视频理解和多轮多图对话。
其他功能:能够生成网页和高质量文章,结合了文本和图像。
模型架构:包含轻量级视觉编码器、大语言模型和部分 LoRA 对齐。
测试结果:在 28 个基准测试中,16 项超过开源模型,16 项接近或超过 GPT-4V 和 Gemini Pro。
模型下载:
https://huggingface.co/internlm/internlm-xcomposer2d5-7b
- 博客歸藏的 AI 工具箱
边学 AI 边挣钱的 GitHub 项目
从 2023/3 月起始用 chatgpt 和 mj 等 ai 起始,咱们已然持续研发了几个 ai 项目。近期,帮忙机构内部文档查找的基于 llama3 的 RAG 项目亦起始安排了。而在这个过程中,咱们才慢慢明白 LLM 是什么,能力的边界在哪里。那些人是可靠的,又有那些人在胡说。
而今天 ai device 的热潮慢慢升温,ai 起始结合硬件。学习的最佳方式,仍然是参与项目。前一段时间介绍的 friend 这个硬件项目就非常有意思。他不仅开源了,况且会在 GitHub issues 里面用悬赏。
例如这个 issues 390 ,你处理了就拿走 100 美金。
https://github.com/BasedHardware/Friend/issues/390
- 博客李楠或kkk
媒介观察
这些有趣的人形设备人争相登场,它们离实际应用有多远?
多位业内人士暗示,倘若设备人将来大规模应用,从制造业到服务业,真正走进公众生活、走近大众身边,陪护老人、陪教儿童等,还有许多 “软硬件” 待升级,包含看得见的零部件灵敏度、安全性等,看不见的数据隐私、算法偏见、伦理道德等,都需要有更全面、更优化的处理方法,保证新技术、新制品的安全和可连续发展。
-新华社
国内首款人形设备人公版机发布,百亿人形设备人产业基金正在弦上
为么发布公版机?很大程度上是因为日前人形设备人产业面临的一系列共性问题。例如硬件层面同质化重发开发,中小企业创新难;软件层面动力学开发周期长,容易摔倒,稳定性不足。
国地共建中心首席专家江磊对 21 世纪经济报告记者暗示,“手机行业曾经经历了从公版机,到日前手机大厂的发展模式。公版机,亦是促进人形设备人快速标准化,通用化最好的方式。等下半年,共创验证无问题,会择机完全开源。”
-21世纪经济报告
硅基流动完成近亿元天使 + 轮融资 国产大模型 “补足弹药” 混战升级
今年败兴,大模型赛道热闹非凡:一方面国内大模型创业机构打响 “价格战”;另一方面,OpenAI 宣布终止对中国研发者供给 API(应用程序接口)服务亦诱发了国内大模型争相推出 “迁移计划”。与此同期,资本亦正在向头部企业进一步聚集。
-每日经济资讯
开放是 AI 危害的独一解
AI 的危害底层是技术问题,因为其决策过程常因技术黑箱而显出奥秘莫测,这种不透明性不仅削弱了公众的信任,还为技术主导者的乱用和误判供给温床。推动 AI 技术的开放势在必行,让更加多人能够深入认识 AI 运作机制。
-北京商报
大模型落地考,难点在哪里?
因此,大模型的能力在多模态方面的突破,会带来 AI 的普惠,为 AI 开启更加多的可能性。原来的投入产出是一个金字塔型结构,即投入很大,然则收益很小;仅有将它变成一个倒金字塔结构,这般才可真正放大它的价值。
新技术在催生新的产业变迁的同期,亦会构建一个新的价值链,AI 产业亦是如此,从单点爆发到各行业的全方位突破,AI 所创造的价值亦将指的是数级的。
-光锥智能
大模型想挣钱,先过这七道难关
中关村科金 CTO 李智伟博士近期发掘,大模型商场闭环,正在被说到很重要的位置。
区别于过去 20 年间中国 IT 行业的发展,可以经过烧钱来快速累积用户,靠估值和宣传实现商场变现;大模型时代,投资市场愈加理性,正在倒逼业界加快实现商场闭环。
-数智前线
工信部赵志国:开放鸿蒙、开源欧拉等优秀开源项目正在走向国际舞台
工业和信息化部资讯发言人、总工程师赵志国在 “推动高质量发展” 系列主题资讯发布会上暗示,生态的打造与构建对信息通信业发展极其重要。日前,我国成立了开放原子开源基金会,开放鸿蒙、开源欧拉等优秀开源项目正在走向国际舞台。
-通信世界网
今日举荐
开源项目
wa-lang/wa
https://gitee.com/wa-lang/wa
凹语言(凹读音 “Wā”)是 针对 WASM 平台设计的通用编程语言,同期支持 Linux、macOS 和 Windows 等主流操作系统和 Chrome 等浏览器环境,同期亦支持做为独立 Shell 脚本和被嵌入脚本模式执行。
每日一博
VLMs 多模态大模型当下发展与思考
在过去的一年中,VLMs 技术取得了飞速发展。本文旨在对这些技术进步进行梳理与思考,但将避免深入详细的论文细节,而是用简明扼要的方式介绍每篇科研的核心思想。
https://my.oschina.net/u/4662964/blog/11323265
开源之声
用户观点
Visual Studio Code1.91 发布 观点 1:graph 最终显现了,期盼搞的更牛批点,比 webstorm 的 git 图形化还好。大众都去点个赞,加快点速度,让 vscode 的 git 更好用!!! github----com/microsoft/vscode/issues/179053
观点 2:mac 更新完,VSC 起不来了
观点 3:日前我用 Git Graph 插件,不外几年没更新了
观点 4:无独立的 git 提交界面李彦宏:无应用,基本模型何足道哉观点 1:比无应用更可怕的是无下限,你的文心一言会不会骗大众去莆田系医院呢?
观点 2:此刻有什么问题还是要 ChatGPT google。某些搜索引擎搜索出来的东西不可看啊。
观点 3:为了吃入,从一个极端到另一个极端?
观点 4:能够预测的将来,百度越是缺钱,百度搜索体验越差,这简直是一个恶性循环,百度搜索结果前两页全是宣传,名副其实的宣传搜索。
观点 5:说的亦没错,现周期 AI 便是适合专向专干。
观点 6:起个大早,赶个晚集。
观点 7:陆奇哭晕在厕所里程序员梗图
END
References
https://mp.weixin.qq.com/s/CUoM87LRvlw53M_NxOaiDA
https://mp.weixin.qq.com/s/SoetAIDZAcebpOvAafJRcA
https://www.pingwest.com/w/296430
https://mp.weixin.qq.com/s/FCpDdDJ2j5_NL_XDIkmHMw
https://weibo.com/5722964389/Om6N3uysr
https://weibo.com/2194035935/OlYMEdmyR
https://weibo.com/6105753431/OlEPf1V9P
https://weibo.com/6182606334/Om7QW71C4
https://weibo.com/1645215240/Om1sUw5ad
http://www.cww.net.cn/article?id=591771
https://mp.weixin.qq.com/s?__biz=MzkwNDMyOTA1NA==&mid=2247490150&idx=1&sn=47c85993df46c11325ecb595078ff90b&chksm=c089f857f7fe7141c708fbd77dd466526cc5804866a8269ce1377f7165e1889974075dd9d6e7#rd
https://mp.weixin.qq.com/s?__biz=MzkyNDIxMDQ1OA==&mid=2247496430&idx=1&sn=8b54eeef094fadbd254afc99d1e0e918&scene=0
https://www.yidianzixun.com/article/0viEg49B
https://finance.sina.cn/2024-07-04/detail-incayqcc8292865.d.html
https://finance.sina.com.cn/roll/2024-07-05/doc-incazvws6719363.shtml
https://3g.k.sohu.com/t/n803341037
https://gitee.com/wa-lang/wa
https://my.oschina.net/u/4662964/blog/11323265
https://www.oschina.net/news/300318/vs-code-1-91-released
https://www.oschina.net/news/300387
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享返回外链论坛: http://www.fok120.com,查看更加多
责任编辑:网友投稿
|