极客摘要
汇聚极客视野,尽览科技前沿
癌症诊疗取得重大突破,专家发掘分裂检测新机制 [1]咱们常说大脑有记忆,但其实身体的每一个细胞亦有自己的"回忆"。最新科研发掘,细胞竟然能记住上一次分裂有多顺利,就像有个内置的"分裂秒表"!日本和美国专家合作,揭示了这一奥妙机制的分子基本。原来,当细胞分裂进行得不顺利时,三种蛋白质p53、USP28和53BP1会逐步聚集在一块。倘若分裂时间超过正常水平,这种蛋白复合物就会海量形成,还能稳定存在,传给新生的子细胞。这些蛋白怎样晓得分裂时间太长了呢?原来一种名为PLK1的酶会给蛋白"计时":分裂拖得越久,它改装蛋白的时间就越长,蛋白聚集亦就越多。高浓度的蛋白复合物会稳定p53,而p53能叫停细胞分裂。这便是细胞的"分裂秒表"!这一精妙的机制或许能解释有些癌症的出现。科研人员发掘,癌细胞的"分裂秒表"常常失灵。这项成果带来了科研癌症的全新思路,或许将来能用于癌症诊疗。极低比特量化导致了设备学习界的广泛关注 [2]当前,极低比特量化导致了设备学习界的广泛关注。将模型权重压缩至1-2比特,矩阵乘法就没需乘法器,大幅提高计算效率。但现有办法多从头训练,代价昂贵。HQQ+的创新之处在于直接量化预训练模型,并引入低秩adapter来提高性能。实验结果令人惊喜。在标准数据集上,1比特量化后的Llama2-7B模型表现很差,但微调少量参数后,竟优于有些小型全精度模型!2比特版本表现更佳,量化前模型在wikitext任务中被量化后的超越;经过数学推理数据的"喂养",量化模型在GSM8K任务中亦胜出。HQQ+的有效源于对量化过程的重构。反量化被改写为低比特矩阵乘+零点偏移,后者进一步被低秩分解,从而只需加法运算。adapter的加入则加强了量化精度。实验还显示,对于中小型模型,极度量化的大模型性价比或许高于从头训练小模型。技术突破也肇于音乐创造 [3]八十年代,青春歌手舒朗·维嘉创作了一曲《汤姆餐馆》。无伴奏,仅凭一把吉他和质朴嗓音,她用简单的旋律勾勒出偶遇纽约街头餐馆的心绪。谁知,这首不到两分钟的"没名小曲"竟这里后十余年诱发了连锁反应:众多混音版本如雨后春笋,从说唱到雷鬼各显身手;德国工程师为其痴迷,以维嘉温暖真挚的声线反复压缩,只为找寻最完美的数字编码——MP3格式由此诞生!回首往事,维嘉感慨万千。她没想到自己"阴差阳错"地参与了数字音乐革命,亦从这段经历中对创作、版权有了更成熟的认识。做为歌手,她以一曲清唱容易出圈;做为作者,她娓娓道来MP3暗地里鲜为人知的故事。读来让人唏嘘不已,亦对技术发展心生敬畏。里根的星球大战计划 [4]说到"星球大战",你可能想到好莱坞大片。但在上世纪80年代,这竟是美国的真实国防计划!1983年,里根总统力推"战略防御倡议",又叫作"星球大战计划",妄图用太空武器守卫美利坚。利弗莫尔实验室的武器狂人们兴奋坏了,各种天马行空的设计争相涌现。最著名的要数"智慧卵石"——成千上万枚微型卫星布满太空,像智能子弹般跟踪来袭导弹并猛烈撞击!还有号叫作终极武器的"X射线激光器",用核爆驱动,摧枯拉朽...真是个疯狂的年代啊!这些想法今天听来或许天方夜谭,但当时可都是顶尖专家绞尽脑汁的心血结晶。尽管"星球大战"最后胎死腹中,"智慧卵石"亦下马了,但它却催生了"克莱门汀"探月计划,让人类重返月球,缔造了新的辉煌。设备狗在机场找到新工作 [5]一只设备"狗"在阿拉斯加机场上岗了!但别想摸摸它的头,由于它基本无头。这只名叫Aurora的设备人,身披仿生皮毛,像极了一只小狼或狐狸,但全身闪烁的绿灯却暴露了它的机械本质。Aurora的任务可不通常——防止鸟类在机场跑道周边聚集,从而避免危及飞行的鸟击事故。它会每小时在跑道巡逻,模仿捕食者的动作吓跑飞鸟和其他野生动物。别看它体型仅有拉布拉多犬体积,灵活性却不输狗狗:它能攀岩爬楼梯,乃至还会一边"跳舞"一边闪灯呢!交通部官员暗示,这创新方法旨在以更人道的方式驱赶鸟类,此前用没人机喷洒葡萄汁驱鸟剂的提议被否决了。过去阿拉斯加亦尝试过在机场湖边放养吃鸟蛋的猪,但效果有限。去年,阿拉斯加各机场共出现92起动物撞击事件,其中费尔班克斯机场就有10起。虽然大都数撞击没导致严重后果,但鸟类被吸入发动机可能酿成空难,代价难以想象。Unix之父肯·汤普森"万恶之源"的骇客技巧 [6]1984年,Unix之父肯·汤普森在图灵奖演说中,揭示了他玩过的一个堪叫作"万恶之源"的骇客技巧。他在C编译器中移植一个"病毒",每当编译登录程序时就加入后门代码,而编译编译器自己时则复制病毒。如此一来,编译器源码中不含恶意代码,却能生成染毒的二进制文件。这种"病毒"能够经过汇编器、链接器、微码等更底层的工具传播,跟踪难度成倍增多。它能轻易感染所有查毒工具,让自己隐身没踪。除非直接写二进制码,否则你很难得到一个"干净"的工具。思虑到政府对百姓信息的大规模监控,这种没法检测的"特洛伊"恐怕已没处不在。美国政府如获至宝,怎会错失这种在任何运行代码里安插后门的终极杀器?这个可怕的漏洞还有解吗?理论上讲,无万没一失的方法。用未感染的老版本编译器重新构建可能有效,但谁敢担保这个过程的纯净?在GPU上实现完整文件系统加速 [7]GPU4FS是一个在GPU上实现的完整文件系统。它将文件系统的管理和操作所有转移到GPU,大幅减轻CPU包袱,同期利用GPU强大的并行计算能力加速文件处理。初步结果显示,GPU4FS在保存文件系统所有功能的同期,能在带宽上与CPU实现媲美。这为高性能计算、图形渲染等GPU密集型应用供给了有效的存储处理方法。GPU4FS有望作为将来加速型文件系统的新范式。RCU垃圾回收机制 [8]本文深入剖析了内核研发中一种名为 RCU 的垃圾回收机制。它巧妙利用不可变数据,经过读写分离和延迟释放内存的策略,在保准性能的同期实现了高并发。这一技术不仅颠覆了人们对垃圾回收效率低下的刻板印象,更彰显了软硬件协同设计的深远道理。它启示咱们,垃圾回收虽非万能灵药,却是系统程序员工具箱中不可或缺的利器。参考链接
[1] 癌症诊疗取得重大突破,专家发掘分裂检测新机制https://arstechnica.com/science/2024/03/proteins-let-cells-remember-how-well-their-last-division-went/
[2] 极低比特量化导致了设备学习界的广泛关注https://mobiusml.github.io/1bit_blog/
[3]技术突破也肇于音乐创造https://archive.nytimes.com/opinionator.blogs.nytimes.com/2008/09/23/toms-essay/
[4] 里根的星球大战计划https://www.llnl.gov/archives/1980s/brilliant-pebbles
[5] 设备狗在机场找到新工作https://news.sky.com/story/headless-dog-sized-robot-to-patrol-alaska-airport-to-prevent-bird-strikes-13104283
[6]Unix之父肯·汤普森"万恶之源"的骇客技巧https://wiki.c2.com/?TheKenThompsonHack
[7] 在GPU上实现完整文件系统加速https://dl.gi.de/server/api/core/bitstreams/7c7a8830-fd81-4e56-8507-cd4809020660/content
[8] RCU垃圾回收机制https://bitbashing.io/gc-for-systems-programmers.html
|