音视频技术开发周刊 88期 - 好文

『音视频技术开发周刊』由LiveVideoStack团队出品，专注在音视频技术领域，纵览相关技术领域的干货和新闻投稿，每周一期。点击『阅读原文
』，浏览第88期内容，祝您阅读愉快。

架构

思科：2022年视频将占移动通信流量79%

近日，思科发布了视觉网络指数（VNI）报告，总结并预测了2017-2022年的全球移动数据流量与增长趋势。报告显示，到2022视频将占所有移动数据流量的79%。此前，思科也曾表示到2022年视频资源将占所有IP流量的82%。

Intel视频处理与分析技术栈和架构纵览

面向WebRTC的英特尔协同通信开发套件设计了一个端到端的全流程实时视频流分析系统，帮助开发者使用极简的代码快速实现符合自身需求的高效实时视频流分析应用。本文来自英特尔开源技术中心研发经理
翟磊在LiveVideoStackCon 2018中的演讲，并由LiveVideoStack整理而成。

AI+AR如何提升花椒直播的体验？

随着全民直播时代的到来，用户对视频质量和创意需求增多，由此产生了视频增强等技术的巨大需求。360资深技术专家刘洛麒根据360在视频领域的开发经验与技术积累，详细介绍了人工智能在视频直播中的技术与相关应用。本文来自其在LiveVideoStackCon
2018大会中的演讲，并由LiveVideoStack整理而成。

MPEG标准概览

从MPEG-A到MPEG-V的标准包括59个规范，这些规范扩展了延续了整个30年的MPEG活动。这些标准占MPEG标准的29%。在这段时间内，MPEG标准解决了更多的相同技术：系统(MPEG-B)、视频(MPEG-C)、音频(MPEG-D)...

传输网络

5G Americas白皮书—5G开源现状

5G系统架构已被定义，但部署初期很可能面临与3G、4G相似的互操作性的挑战。尽管如此，5G系统架构为移动运营商提供了比前几代更大的开放性，运营商也需要利用开源原则才能保持和提升市场竞争力。本文概述了5G架构，重点介绍了其开源原则及应用，并探讨了这种组合将如何使移动运营商及其客户受益。

SRT协议

SRT是基于UDT传输协议，是用户级别的协议，其保留UDT的核心思想和机制，但是做了多项改进，包括控制报文的修改，针对直播流改进了流控，改进了拥塞算法，报文加密算法。本文介绍SRT协议本身。

音频/视频技术

基于SRT传输协议的直播服务

srt_live_server是基于SRT传输协议的直播服务，支持MPEG-TS格式的推流，拉流。

从若琪，今天杭州的天气为例。让你全面了解什么是语音交互

本文是面向 Web
开发者所写，介绍关于“语音交互”的一篇科普性质的文章，希望借助这篇文章，让开发者了解到什么是语音交互，以及YodaOS（https://github.com/yodaos-project/yodaos）中的技术实现。

SoundTouch与Rubber Band Library变声算法对比与ASR结果分析

常用的开源变声算法有SoundTouch 和Rubber Band Library。其中
SoundTouch是一款用C++编写的开源的音频处理库，可以改变音频文件或实时音频流的节拍(Tempo)、音调(Pitch)、回放率(Playback
Rates)......

编解码

H.264 中的 NAL 技术

NAL 全称 Network Abstract Layer，即网络抽象层。在 H.264/AVC 视频编码标准中，整个系统框架被分为
了两个层面:视频编码层面(VCL)和网络抽象层面(NAL)。

iOS硬解码H264视频流

苹果在iOS
8.0系统之前若要做音视频开发需使用第三方软件进行编解码(FFmpeg软解码H264视频流可看到这里)，学习成本较大，项目开发进度也可能超出预期。在iOS
8.0之后开放了视频编解码框架VideoToolbox，在此之后对于音视频开发变得相对简单。

压缩效率比H.265更高，揭秘腾讯无线投屏背后的屏幕编码技术

本文将给大家揭秘腾讯无线投屏背后的屏幕编码技术（Tencent Screen
Encoder，以下简称TSE）,对于屏幕内容图像，TSE相比x265(normal模式)，压缩效率提升55%。

小视频app开发过程中的两种编码标准

对于大多数直播平台来讲，带宽构成了其成本的绝大部分。而对于短视频平台来讲，带宽成本所占的比例可能会更高。在小视频app开发过程中，经常会遇到各种各样的问题，再加上4k、6k视频及5G即将到来，带宽成本也会随之增加。为了解决高昂的带宽成本，节省带宽成了众多短视频平台的首要任务，而视频编码标准的选取也将会间接影响带宽成本。常用的视频编码标准有H.264和H.265两种。

安卓硬解码H264播放器的实现

直播功能应用非常广泛：除开一般的直播App，远程教育、远程会议、视频聊天、甚至是简易的手机家庭监视器、蔬菜大棚监控都需要使用相关的技术，至于直播功能的子集——游戏语音聊天，AAC编解码的使用场景就更加广泛了。

H264视频--x264编解码原理详解

H264编码原理：首先对每一帧图像进行宏块划分，有不同的划分方式，然后对相邻图像进行分组。在这样一组帧中，经过编码后，我们只保留第一帖的完整数据，其它帧都通过参考上一帧计算出来。

AI智能

MWC2019最全AR/VR汇总：HoloLens 2来袭，5G云VR火爆

毫无疑问，今年的MWC依然是5G技术集中展示的天堂，与去年相比今年5G应用演示更丰富，5G终端包括手机、CPE等也越来越多。与此同时，本届MWC微软发布了重磅的HoloLens
2混合现实头显，同时HTC带来Vive Focus Plus，虽然AR/VR新品不多，但技术总是在进步。接下来，我们就来汇总一下MWC
2019中AR/VR新产品、新应用。

face.evoLVe：高性能人脸识别开源库，内附高能模型

目前人脸识别开源项目众多，但真正能方便快捷拿来就用、性能指标业界领先的开源库并不多，而最近刚刚开源的face.evoLVe绝对是不容忽视的力量。

机器学习中的编码器-解码器结构哲学

机器学习中体现着各种工程和科学上的哲学思想，大的有集成学习，没有免费午餐，奥卡姆剃刀；小的有最大化类间差异、最小化类内差异。对于很多问题，存在着一类通行的解决思路，其中的一个典型代表就是“编码器-解码器”结构。这一看似简单的结构，背后蕴含的工程思想却非常值得我们学习和品味。

纯Deep Learning干货 | 快慢网络用于视频识别

该技术是由何恺明等人提出的，主要用于视频识别的SlowFast网络，提出要分开处理空间结构和时间事件。该网络模型在视频动作分类及检测方面性能很强大，在没有使用任何预训练的情况下，在Kinetics数据集上实现了当前最好的性能水平，在AVA动作检测数据集上也实现了28.3mAP的当前最优异性能表现。

图像

Android色彩矩阵处理图像

Android中对于图片的处理，最常使用到的数据结构是位图——Bitmap，它包含了一张图片所有的数据。这个数据都是由点阵和颜色值组成的，所谓点阵就是一个包含像素的矩阵，每一个元素对应着图片的一个像素。

热门工具换一换