每周一期,纵览音视频技术领域的干货和新闻投稿: contribute@livevideostack.com。
架构
PSA: WebRTC M79 发布
更改统计信息方式并为 mDNS 增加企业级策略控制。
IP 摄像头直播视频流: RTSP 转 WebRTC
Red5 Pro 介绍了他们的 Restreamer 插件。
运用机器学习技术的免费婴儿监测系统,且能够保障数据传输安全
该方案使用了 WebRTC 技术,能在检测到婴儿哭声的同时过滤掉周围所有其他噪音。
新浪微博: 大规模离线视频处理系统的架构设计
微博视频平台在4亿月活用户吃瓜嗨聊的高并发、大流量背景下,既要保证用户微博生产和消费体验,又要支持业务快速迭代,确保正确性、稳定性和高可用性。 本次演将以微博视频大规模视频离线处理系统的架构设计为主题为大家带来大规模分布式系统的架构设计,性能优化和高可用保障等一线实战经验。
传输网络
基于IP的媒体直播协议
本文来自VSF.tv 2019年十月的演讲,演讲者是来自Telecompro.tv的Wes Simpson和来自Q3 Media的Ed Calverley. 本次演讲的主要内容是关于现代IP音视频网络的关键技术,ST2110, AES67, PTP和NMOS,以及它们是如何共同作用以实现全IP直播的。
在通信约束下从样本中学习分布
演讲者在本文中介绍了不同的通信协议,首先是独立协议,也就是每个节点单独决定如何编码产生这k比特,所以这些每个节点的信息都是独立的随机变量,这也是独立协议名字的由来。 第二种是顺序协议,这种协议下节点可以进行一定程度上的交互。
各种TCP拥塞控制算法
自从TCP拥塞控制的概念提出以来,TCP拥塞控制算法经历了一系列的演化。 这里根据网上的资料大致总结一下各个TCP拥塞控制算法。
编解码
浅析视频编解码技术的发展历程和未来趋势
视觉是人类获取信息的主要途径,图像与视频在人与计算机的交互过程中扮演着重要的角色。 进入21世纪以后,人们面临的是一个高速发展的信息化社会。 数字化后的信息,尤其是数字化后的图像和视频信息具有数据海量性的特征,给数据存储和传输造成了非常大的困难。 基于现有的音视频压缩技术的不足,研究和开发新型有效的多媒体数据压缩编解码技术,以压缩的形式存储和传输这些数据刻不容缓。
SPRING—用于FASTQ数据的下一代压缩器
本文是来自Stanford Compression Workshop 2019的演讲,作者是来自斯坦福大学的博士毕业生,Shubham Chandak,他致力于基因组数据压缩和DNA存储方面的研究。 本次演讲主要讲述了用于FASTQ数据的新一代压缩器SPRING。
视频技术
为您的 Squarespace 网站添加音视频录制功能
我们需要更多这样的能与网站建设者进行集成的功能。
既让VR模糊后,Facebook: 这次我们让VR更清晰
近期Facebook Reality Labs再次公布了一项新的VR/AR视频成像相关技术: DeepFovea。 简单来讲,这是一个基于AI的注视点渲染方案,它可以通过较为稀疏的像素,来生成高清且逼真的图像。
基于 Android 的可视频控制的小车
由声网 Agora 举办的首届AI in RTC 大赛,已在10 月 24 日圆满落幕。 其中,参与创意编程赛道的 100 多支参赛队伍在 3 个多月里挥洒创意与热情,带来了许多用心的项目。 我们邀请了获奖的参赛队伍们,逐一分享了他们的开发实践。 buggy 团队基于 Android 手机、开发板、传感组件等,开发了一个可通过手机远程控制,支持视频的小车。
人物专访
Akamai Martin Horčička: 最新网络优化技术及编程语言分析
在LiveVideoStackCon深圳站开场之前,我们邀请到了Akamai公司的研发经理Martin Horčička来接受我们的采访,采访中Martin向我们分享了他早期关于UNIX相关的OS、网络和开发的工作以及对于近几年编程语言发展的看法。 除此之外Martin还提供了关于multi-connection和P2P的一些技巧,最后,Martin还谈到了Akamai最近的项目在基于UDP的安全传输协议做一些优化。
张贤国: 视频压缩还远没有达到最优
正如张贤国所说,V265在MSU视频编码大赛取得成绩的背后是腾讯内部多团队合作的结果。 在视频编码优化这条路上还有许多工作要做,团队合作就变得格外重要。 本文是MSU2019视频编码大赛系列解读的第一篇。
唐敏豪: 我给MSU评测打9分
在唐敏豪看来,MSU视频编码大赛是目前业界规模最大的编码器客观评比平台,对视频编码器的开发者和使用者都有很高的参考价值,但MSU的评测对于特定的业务场景不具有绝对的参考价值。
AI智能
NeurlPS 2019 | 旷视研究院推出可学习的树状滤波器,实现保留结构信息的特征变换
在图像语义分割任务中,学习到有足够判别力度的全局特征十分重要。 现有大部分方法要么采用堆叠多层局部卷积层,要么使用非局部的block来获取远距离特征之间的语境。 然而,由于这些方法都缺乏对空间结构信息的有效保留,在增大感受野的同时忽略了物体结构的具体信息。 因此,在本文中,旷视研究院团队提出了一个可学习的树状滤波器,它能够在建模远距离语境关系时依然保留细节信息。
深度学习在图像处理的应用一览
计算机视觉的底层,图像处理,根本上讲是基于一定假设条件下的信号重建。 这个重建不是3-D结构重建,是指恢复信号的原始信息,比如去噪声。 这本身是一个逆问题,所以没有约束或者假设条件是无解的,比如去噪最常见的假设就是高斯噪声。
图像
快速上手网易云音乐可视化
音频可视化,顾名思义,就是通过获取音频的波形、频率和其他来自音频的数据转换成图像,再到屏幕上显示出来。 通过它,我们能够制作一些炫酷的前端音乐界面。
资源推荐
Flutter实战
一个基于 Flutter 的个人项目
活动推荐
硬派多媒体技术方案沙龙·2019深圳
从WebRTC、低延迟直播到边缘计算,从编解码Codec到AI加速,从全景视频到沉浸式音频,从5G到超高清,从金融、教育、制造等行业应用场景优化到QoE用户体验......硬派多媒体技术方案沙龙(Impact of Multimedia Technology Solution Meetup)旨在甄选技术领先、成熟的方案与案例,推动技术传播,连接多媒体技术生态上下游。
Xilinx视频加速技术专场
从AI到编码、转码,硬件加速方案正在扮演越来越重要的角色。本专题,将展现基于FPGA的硬件加速特性,在视频、图片编码与转码以及AI计算方面带来的收益。
点击“ 阅读原文 ”可查看更多详细信息,请大家科学上网。
原文 http://mp.weixin.qq.com/s?__biz=MzU1NTEzOTM5Mw==&mid=2247493719&idx=1&sn=e69414c422a67325ce3150afbcf541a5