2024-12-28 08:29:00
许多神经网络系统都是随机的,这意味着提供相同的输入并不总是会产生相同的输出。此类人工智能系统的行为是“涌现突发性的”,这意味着尽管每个神经元的行为都是由精确的数学公式给出的,但这种行为和节点的连接方式都无法解释网络的整体行为。我最初 20 年的研究方向是形式化方法,其中使用数学和逻辑来确保系统按照精确的形式化规范运行,或者至少支持对已实施系统的验证。形式化软件工程的一个核心属性是组合性: 即可以根据复合系统各部件和组合两个方向含义来理解复杂性系统, 而不是只查看部件本身含义。 这一理念是分段开发的核心: 各个部件可以单独设计(和验证),因此可以并行进行,并以模块、库等形式以“黑盒”方式重复使用
2024-12-28 07:10:00
本月,经合组织公布了一项大规模调查的结果:对 31 个不同国家和经济体的 16 万名 16-65 岁成年人的读写、算术和解决问题的能力进行了现场评估。与十年前的最后一组评估相比,读写能力的趋势引人注目。 只有两个国家(芬兰和丹麦)的熟练程度显著提高, 14 个国家的熟练程度保持稳定, 11 个国家的熟练程度显著下降,其中韩国、立陶宛、新西兰和波兰的熟练程度下降最为严重。 在接受过高等教育的成年人(如大学毕业生)中: 13 个国家的识字能力下降,只有芬兰的识字能力有所提高, 而几乎所有国家和经济体的高中以下教育程度的成年人的识字能力都下降了。 新加坡和美国在识字和算术能力方面的不平等现象最为严重
2024-12-27 13:29:00
《自然》杂志上的一篇文章:“逆转录转座因子在衰老和年龄相关疾病中的作用”。逆转录转座因子RTEs是一类可以在基因组中“跳跃”的DNA序列,它们通过转录成RNA并逆转录回DNA的方式进行复制。 这些因子在人类基因组中非常丰富,占据了大约一半的DNA。 它们不仅可以影响基因表达,还可以通过插入突变影响基因功能,与多种疾病的发生发展有关。 随着年龄的增长,逆转录转座因子RTEs的活性增加,可能会导致基因组不稳定性增加,进而促进衰老和相关疾病的发生。例如,一些研究表明: RTEs的激活与神经退行性疾病、心血管疾病和癌症等年龄相关疾病的发生有关。 此外,RTEs的激活还可能引发宿主的免疫反应,导致慢性炎
2024-12-27 08:51:00
阿里巴巴的人工智能研究团队 Qwen发布了 QVQ-72B-Preview,这是一种可以分析图像并从中得出结论的新开源模型。虽然它仍处于实验阶段,但早期测试表明它在视觉推理任务方面特别出色。要点: 阿里巴巴 Qwen 研究团队发布了 QVQ-72B-Preview,这是一个开源语言模型,能够分析视觉信息并从图像和指令中得出复杂的结论。 该模型以循序渐进的方式处理信息:它读取图像和指令,分析内容,得出结论,并输出预测和置信度值。在基准测试中,该模型在数学和物理方面的表现优于同类模型。 尽管 Qwen 功能强大,但它也存在一些局限性,例如混合语言、陷入逻辑循环以及失去对图像的关注。该团队的目标是解
2024-12-27 08:41:00
中国人工智能公司 Deepseek 刚刚发布了迄今为止最强大的语言模型。早期测试表明,新的 V3 模型可以与一些业内领先的专有模型相媲美,并且在逻辑推理任务中表现出特别的改进。该模型现已在 Github 上发布,采用混合专家 (MoE) 架构,共有 6710 亿个参数,其中每个 token 激活 370 亿个参数。这比 V2 有了显著增加,V2 共有 2360 亿个参数,其中 210 亿个参数在推理过程中处于活动状态。训练也更加广泛,处理了 14.8 万亿个 token,几乎是 V2 训练数据的两倍。据 Deepseek 称,整个训练耗时 278.8 万个 H800 GPU 小时,成本约为