音频质量评估中的 ABX 测试

在音频编解码中,经常需要判断经过不同的编解码算法、参数而生成的音频在人的感知层面是否存在差异。虽然 成对打分 也可以用于这种场景,但是成对比较的结果可能会涉及到很多无意识的影响因素,例如不同受试者的经验、心情等。如果受试者采用随机选择的策略,对于成对比较而言,则缺乏有效的手段来对其进行识别。

阅读更多...

如何计算多组 ACR 打分的 ELO 积分

有趣的 Elo 积分系统 这篇文章中,我们介绍了 Elo 积分系统的基本原理,并介绍了我们如何在视频评估系统中采用 Elo 积分来评估不同编解码器之间的性能。不过,之前文章中介绍的是对于 成对打分 场景下应用 Elo 积分,在本文中,我们将介绍在 ACR 打分场景 下如何采用 Elo 积分评估不同方案的性能。

阅读更多...

Sora——AGI 漫漫长夜中的星光

Prompt: 一位时尚的女士漫步在东京的街道,街道上充满了温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克、红色长裙和黑色靴子,手里拿着一个黑色钱包。她戴着太阳镜,涂着红色的口红。她走路自信而随意。街道潮湿且反光,形成了彩色灯光的镜面效果。街道上,许多行人走来走去。

2024 年,2 月 16 日,农历的大年初七,当我们还沉浸在春节假期的团聚与欢乐时,大洋彼岸的 OpenAI 突然发布了轰动科技街的最新研究成果——Sora。利用如上的 提示词,Sora 可以生成较高画质的、非常逼真的、长达一分钟的视频。就像当时 ChatGPT 发布一样,Sora 的发布又一次引爆了技术大讨论。正如 Sora 的开发者 Bill Peebles 所说的那样:Sora 令他们非常兴奋,他们可以通过模拟一切来不断地追求 AGI。[1]

we’re pumped about pursuing AGI by simulating everything!

阅读更多...

大话线上事故

这就是微服务,这就是线上事故——17哥

微服务架构虽然解决了单体架构下的部署、运维、扩展、效率等痛点问题,但是它让系统架构变得更加复杂。很多时候,微服务架构用的不好,就很容易形成分布式单体的效果,最终导致很多非预期的线上问题。

如上图所示,当我们兴冲冲的发现了一个线上 BUG,满怀激动的修复好,然后一脸骄傲的点下发布按钮之后,我们才深悟痛彻的理解了那句:“能跑就别动它”。

我的同事将自己工作中遇到的一些线上问题的案例进行了提炼、总结,然后形成了这篇文章——其中很多案例即有趣又痛心——希望对大家有所帮助。

阅读更多...

大语言模型实践

这是一本关于 大语言模型 实践的书籍,而不是一本深入研究 大语言模型 的运行原理和底层算法的书籍。如果您是一位想深入学习框架、算法并对其进行优化改进的研究者,本书可能并不适合您。如果您想大概了解一下相关的概念,并以此来指导自己的实践,想了解目前在应用开发中有哪些工具以及这些工具的具体实践用法,那么这本书正是为您你而作。

阅读更多...

LangChain 简介

我们不想花更多的力气来实现和LLM交互的流程,而是更关注于业务逻辑的实现;我们也不想重复编写相似的流程代码,而是可以共享我们的成果,别人只需要键入 docker pull 就可以使用我们的成果……如果你有这样的想法,那么 LangChain 正是你的菜~

阅读更多...

我的“逆向工作”实践

2023 年 4 月 1 日,我在 LiveVideoStack 2022 北京站 大会上,以 《百度视频质量评测的实践之路》 为题介绍了团队在视频质量评测方向的思考与认知。回首向来萧瑟处,金戈铁马,苍山如海。

站在后验结果的视角来审视这个过程,发现有很多的地方——尤其是“逆向工作”思路对整个事情的推动,值得进一步思考与总结。同时,最近和同事在讨论其他方向的工作思路时,我发现“逆向工作”这个词频繁的出现。再加上,近来又在读贝佐斯的 24 封“致股东信”,在 2008 年的“致股东信”中提到的“逆向倒推”深深启发了我。因此,更想对过去的这一段工作进行一番总结。

阅读更多...
  • Copyrights © 2020-2024 wangwei
  • 本站访问人数: | 本站浏览次数:

请我喝杯咖啡吧~