朝花夕拾!

发表于2025-03-09

一、背景二、论文集合听完：EZ.Encoder Academy：博主讲的部分文章，个人认为讲的还是：非常不错的，收集下相关链接： 1、《EZ撸paper: DeepSeek-R1 论文详解 part 1：比肩 OpenAI-o1，如何做到的？| 论文深度解读+独家分析》：https://www.youtube.com/watch?v=tRuN8xYdETs&t=1610s 2、《R1的黑马之路：它是如何超越O1？小修小改，还是彻底颠覆？》：https://www.youtube.com/watch?v=-9HODvpVD2o 3、

视频切片并行加速

发表于2025-03-07|媒体处理

背景在实际业务中，视频处理，大都时候都挺费时的。例如：以下表格是，某中算法，在不同分辨率、帧率下的，cpu计算耗时体系（不包括：上传、下载的耗时）：分辨率帧数处理时长 / 视频时长 720p 30帧 2 720p 60帧 4 1080p 30帧 3 1080p 60帧 6 2k 30帧 3.5 2k 60帧 8 4k 30帧 7 4k 60帧 20 另外，一般情况下，视频越长，所占用的cpu or...

算法工程化

发表于2025-03-01|媒体处理

背景将相关算法部署，并提供一个 or 多个http接口，服务于业务方。算法大学中所学的数据结构课本上说：算法是指解决问题或执行任务的有序步骤集合。当然，如此描述的算法，相当准确。但是，对于实际工程落地而言，还是过于：抽象。这里面描述的算法，是指：算法同学所交付的可执行文件 orso库，例如：视频压缩领域的：264算法，交付的产品：集成到ffmepg中的libx264。例如：如下命令，是使用：libx264算法真正去压缩一个视频的命令，那么：对于实际工程落地而言，所提供的带上libx264的ffmpeg可执行程序，可以简单地理解成：算法 1ffmpeg -i source.mov -s 1280x720 -profile:v high444 -c:v libx264 -preset veryslow -crf 30 -r 30 -g 120 -keyint_min 30 -sc_threshold 40 -bf 3 -b_strategy 2 -refs 5 -c:a libfdk_aac -profile:a aac_low -b:a 128k -movflags...

从0到1搭建媒体处理体系

发表于2025-03-01|媒体处理

背景作为公有云重要组成部分，云端媒体处理体系，可以通过将图片、视频、音频等的计算处理移至云端，让用户享受到更高效、灵活、可扩展的服务。业界调研公有云缩写产品名称备注阿里云 MPS 媒体处理、媒资库腾讯云 MPS 媒体处理百度云 MMS 多模态媒资检索火山引擎媒资库、视频库华为云 MPC 媒体处理七牛云智能多媒体服务又拍云云处理其实，无论叫啥名字，它们的本质做的事情是一样的。其整体流程图如下：怎么搭建经过抽象，想要搭建一套媒体处理，包括以下模块，如下图所示：说明：1、上述图展示的是：包括了多少个功能模块，并非调用顺序，各个模块的调用顺序，得根据实际功能来定，会有专门的模块来分析。功能云处理的功能，用公式来表达：媒体s = fn (媒体s，参数)，有以下特点：1、媒体，只是狭义上的媒体，单纯地指：图片 + 视频 + 音频。2、带上s，证明可以是：多个，也可以是0个，入参 +...

版本核对

发表于2024-08-11|媒体处理

背景在实际媒体计算的业务场景中，如何确定计算后的图片 or 音频 or视频符合上线标准？最简单的办法：手动跑图，然后，人眼看，主观判断是否符合上线标准。这种方法，随着核对算法越来越多，跑图张数越来越多以后，会变得越来越吃力。核对流程对于用户而言，其整体工作流程如下：概念定义1、版本核对，以某个版本的算法的跑图结果作为基准，新开发的算法的跑图结果与此基准跑图，做差异性检测。如果有差异，则人工介入分析。其中，两个版本的算法，跑图必须一样 + 算法入参也必须一样，注意：必须2种结果：以其中一个为基准，确定另一个是否满足预期。 2、版本择优：同一个算法，入参图片一样，但是，算法入参不一样，计算出多种结果，然后，主观选择最好的一种上线。注意：2种以上的结果。 3、画质评测：同一个算法、入参图片一样，算出一种结果，通过人眼主观评测，得出当前结果的画质值，注意：可以只有一种结果。 4、自主跑图：自动调用手机 or 电脑 or api,自动跑出一批图片 or 视频出来。分类按照跑图媒介进行分类：名称分类说明备 ...

流程决策

发表于2024-07-21|媒体处理

...

媒体处理开放平台

发表于2024-03-23|媒体处理

功能定位在互联网时代，将算法、模型的处理能力，封装成一系列业务能理解的接口开放出去，供第三方开发者使用，这种行为就叫做OpenAPI，提供开放API的平台本身就被称为开放平台。需求梳理如：从0到1搭建媒体处理体系的架构图所示，开放平台包括以下功能：功能优先级功能说明备注协议转换 T0 将千变万化的用户协议，转成内部的标准文件处理协议参数校验 T2 确保入参满足要求鉴权 T0 确保接入请求都合法，没有所谓的：水平越权 or...

数据集市

发表于2024-03-21|高性能、高并发

背景当某个app的DAU呈45°上扬，从百万DAU，到千万DAU，甚至过亿DAU，无论是组织架构，还是：经典的db +缓存策略，会变得越来越无法灵活面对纷繁复杂的业务场景。具体表现如下：专业人做专业事任何一个团队的成员构成比例，既有资深的，也有新人。一般情况下，都是让新人介入实际业务需求，那么，该新人就得在熟悉业务的前提下，也需熟悉目前的：db +缓存策略。那么，可否让新人刚开始只关注于：业务。等业务熟悉以后，再去关注：db + 缓存策略呢？成本优化过五百万dau以后的业务，功能也是非常多的，此时，db +cache策略一般都还在业务代码中，面对如此境遇，单靠2、3个所谓的架构师，想要在确保当前功能不变的情况下，做到：性能优化...

多云元数据服务

发表于2024-03-17|媒体处理

背景如前文所述，想要搭建一套云处理体系，有很多配置需要CRUD，因此，需要一套元数据配置服务，存储 or...

说说报文

发表于2024-03-10|网关

概念通信报文，说白了就是一串有规律的、易于理解的数据流，而“有规律”就是用技术规范、协议、标准、接口文档等来描述的。对于我们而言，一般就是接口文档；为啥需要报文各个计算机设备之间，需要交换数据，数据是通过网络来传送的，而在网络上传送的数据都是基于0或1这样的二进制数据，如果没有对数据进行编码，则这些数据没有人能够理解，属于没有用的数据。而经过一些协议、技术规范、接口文档等规范过的数据(有规律的数据流，也就是通讯报文)，才是有用的数据，才能被别人理解。分类按通讯报文的具体格式分，比较常用的有以下几种：1、定长报文2、ISO8583报文3、分隔符报文4、Xml报文5、Schema报文6、Json报文7、Swift：MT、MX报文8、混合报文9、pb报文10、hession报文备注： 1、当前互联网的实际项目中主流用的是：http + json报文。