ZengYan Liang - Homepage

本人目前任职于新浪微博，10年互联网算法领域深耕经验，现任算法团队负责人（带5人）。精通深度学习类算法，对大模型、推荐、自然语言、视觉、视频领域算法均有掌握，擅长将算法模型落地到实际业务。主导多项核心算法项目，带领团队完成算法优化、模型迭代，推动各项核心指标大幅提升。具备完整的团队管理经验，擅长团队敏捷开发，打造高效协作的算法团队，兼顾技术深度与业务价值。工作至今，已累计申请算法发明专利21项。

近三段工作成果是：

主导主题音频推荐算法项目，完成算法发明专利3项；开展1周AB实验（放量50%），实现点击PV提升12%、点击UV提升6.76%、播放时长提升5.51%、播放UV提升0.52%、播放VV提升31.17%；长期优化后，ctr数据从3月份均值1.3%提升至6月份均值1.9%，同比提升46%，显著提升音频推荐转化效率。
主导分类音频推荐算法项目，完成算法发明专利2项；开展1周AB实验（放量50%），实现点击PV提升9.91%、点击UV提升6.85%、播放时长提升5.61%、播放UV提升0.64%、播放VV提升19.89%；下半年承接音频项目KR指标，将推荐定量指标由ctr转为音频播放页时长，Q4音频播放页平均时长达9.7万分钟，指标完成率82%，达成业务核心目标。
主导算法团队与产品、工程、业务部门的协同，推动算法需求拆解与落地，实现技术与业务的深度绑定，获得业务方高度认可。
猿辅导时期，主导的英文作文批改、多模态项目你画AI猜、作业美化项目均已投入使用，期间完成12项算法发明专利。
小米时期，首次突破移动端视频超帧算法，打破端侧只能利用芯片进行超帧的壁垒，原创超帧算法在相关数据集测试达到state of the art水平，期间完成6项算法发明专利。

个人技能

大模型与智能体
框架：熟练使用 AutoGen、LangChain、LlamaIndex、LiteLLM 构建多智能体协作系统；
训练与推理：精通 Transformers、TRL、Llama-factory、PEFT、DeepSpeed 微调及 vLLM 高性能推理加速；
前沿技术：深入理解 ReAct 思考链，具备 MCP 及 RAG 实战经验。
核心算法与框架
深度学习：精通 PyTorch（曾编写知乎《Pytorch教程》）、TensorFlow 框架；
领域积累：深入掌握推荐算法（召回/排序）、NLP（实体识别/翻译/语义）、CV（多模态/超帧/检测/分割/跟踪/OCR）；
传统算法库：熟练使用 OpenCV、Scikit-learn、NLTK、FFmpeg 等工具。
算法工程部署与端侧推理
高性能部署：熟练使用 Triton、TensorRT、CUDA、OpenCL 核函数编程；
后端开发：FastAPI、Flask、NextJS、Spring Boot 及 RPC 协议，掌握 Make/CMake 构建体系；
大数据存储：Milvus/Faiss 向量数据库、ES、Spark、Hive、MySQL、Redis；
中间件与容器：Docker 容器化、Kafka、Nginx，掌握 RabbitMQ、Celery 分布式任务调度；
端侧迁移：熟练使用 ONNX、LibTorch、SNPE、NCNN、MACE 等移动端推理框架。
编程语言
精通：Python, C/C++, Shell；熟悉：Java, JavaScript, C#
资质与影响力
职称荣誉：人工智能中级职称（中科院）；
技术成果：累计获得 27 项算法发明专利；知乎专栏《AI编程教程：Pytorch》作者；
个人网站：liangzengyan.cn

教育&工作

教育经历

2012 - 2015

计算机科学与技术

贵州大学硕士

2007 - 2011

电子信息工程

成都信息工程大学本科

工作经历

2024.11 - 至今

高级算法专家/算法主管

新浪微博

2022.11 - 2024.7

高级AI应用算法研发

猿辅导

2022.5 - 2022.11

Expert Engineer

虾皮

2020.4 - 2022.5

中级算法工程师

小米

2019.2 - 2020.3

机器视觉算法工程师

眸视科技

2018.1 - 2019.1

算法工程师

新橙科技

2016.7 - 2017.9

算法工程师

华尚高新

项目经历

主题类音频推荐项目（LLM+推荐）

简介：负责微博音频推荐全流程算法研发，解决精准召回、个性化排序及高并发部署问题，支撑业务指标提升。
工作：数据工程（Spark/Hive拉取，LLM生成主题/关键词，Milvus向量存储），召回策略（Jina V4向量检索，热搜词冷启动），模型优化（Qwen3-14B，创新引入MoE-LoRA架构），精排优化（ONN-Sparse改进，专家门限机制），工程部署（Triton服务，Redis异步Pipeline）。
成果：申请算法专利3项；AB实验点击PV提升12%，播放VV提升31.17%，CTR提升46%。

类别类音频推荐项目（策略优化）

简介：主导类别类音频推荐算法研发，聚焦音频分类、排序策略及展位动态调整，提升用户留存与消费体验。
工作：音频分类（LLM对ASR内容打标，Crontab自动更新），排序策略（多因子加权，展位分段策略，周榜更新机制），偏好匹配（Jina V4向量匹配），动态展位（智能体Agent动态配置策略），体验优化（同作者去重，块分割随机扰动），工程部署（Redis异步Pipeline）。
成果：申请算法专利2项；AB实验点击PV提升9.91%，Q4音频播放时长完成率82%。

内容精准投放与广告GMV提升（Multi-Agent）

简介：以多智能体（Multi-Agent）技术为核心，实现用户意图与内容/广告的精准匹配，突破传统投放效率瓶颈。
工作：架构设计（基于AutoGen框架，遵循ReAct范式），核心技能（用户意图识别、内容检索、广告主题匹配），召回策略（Milvus两步召回：粗召回+意图细召回），工程部署（MCP服务托管，实现智能体技能自动化触发与调度）。
成果：AI创新项目，方法被搜索部采纳，申请算法专利2项，有效提升留存率与广告GMV。

工业机器人私有知识库（图文RAG）

简介：负责工业机器人私有知识库全栈搭建，以RAG技术为核心，打造图文并茂的高效检索体系。
工作：平台搭建（React + FastAPI，多级目录管理），多尺度检索（BGE-M3模型，LlamaIndex解析PDF/Docx图片与文本），重排优化（BGE-reranker-base），图文创新（Milvus存储切片与图片位置关联，实现检索结果图文同步渲染），数据闭环（全流程自动处理）。
成果：平台全功能上线，使相关文档检索效率提升60%以上，显著提升文档阅读体验。

英语作文批改与润色（LLM微调）

简介：飞象星球学生端核心产品，利用大模型技术提升学生英语写作能力，优化产品体验。
工作：数据工程（采集清洗，GT制作，JSON生成），提示词工程（评分、纠错、润色三大模块，迭代7个版本），模型微调（Llama2-7B-Chat，LoRA微调，FP16），性能优化（LoRA融合，vllm推理加速，TP=2），工程部署（双机房RPC服务，V100-32G）。
成果：产品成功落地，实现批改润色全流程自动化，获得用户广泛认可。

你画AI猜（多模态识别）

简介：飞象双师课堂欢迎产品，通过多模态技术实时识别学生绘画作品，激发对AI的探索兴趣。
工作：数据工程（Quick_Draw数据集筛选，图文对制作），模型优化（Clip-Vit-32基座，Wise-ft方法冻结Backbone微调线性层），性能优化（文本向量库分组，模型预热Warmup，QPS=19.97），工程部署（RPC服务，Console云平台）。
成果：申请算法专利1项，实现多模态技术在教育场景的成功落地。

大模型基础支撑服务（Cache & RAG）

简介：整合大模型缓存与RAG服务，为公司解题、作文、双师AI等多个产品提供底层技术支撑。
工作：缓存服务（Faiss-GPU框架，多节点同步策略，时序向量数据库管理多轮对话），RAG服务（LangChain框架，文档同ID多段拆分，Faiss检索加速，QPS=20），统一部署（RPC服务，双机房高可用架构）。
成果：累计申请专利2项，缓存服务显著降低海外模型使用成本，达成降本增效目标。

教育学科知识点命名识别（NER）

简介：负责学科图谱知识点扩增，提升图谱覆盖度与细粒度，支撑个性化复习场景落地。
工作：数据工程（题目采集清洗，GT制作），提示词与微调（Aton-7B-Chat基座，LoRA微调，FP16），性能优化（vllm推理加速，QPS=2），生成策略（流式输出+贪婪检索），后处理（知识点去重与图谱校验），工程部署（双机房V100）。
成果：显著提升知识点细粒度，实现知识点识别、生成、筛选全流程自动化。

视频画质分析服务（CV/Vision Transformer）

简介：全流程研发画质分析SDK，精准识别增强效果不佳的Badcase，支撑视频增强算法迭代。
工作：框架搭建（C++开发画质分析SDK），内容理解（集成三明治检测与人脸检测），画质评判（Vision Transformer - MUSIQ模型训练，SPAQ/SPV数据集微调），核心指标（PLCC达93.2%，Badcase召回率83%）。
成果：服务成功落地，实现每日增强视频自动化分析，有效支撑算法快速迭代。

移动端视频超帧（算法/模型移植）

简介：小米手机视频播放器核心插件，实现2倍超帧功能，提升视频播放流畅度。
工作：算法研发（基于AdaCoF训练，自研多尺度运动信息插帧网络VFI-FMSMI），移动端移植（SNPE/MACE框架适配，OpenCL自定义算子实现），优化处理（光流校正，场景切换精准判断）。
成果：算法达到State-of-the-art水平，自研算法有效解决高分辨率视频插帧痛点。

小米相册魔法换天（图像分割）

简介：负责小米手机相册核心应用研发，实现拍照天空区域的快速、精准分割与替换。
工作：模型研发（基于U2Net训练，自研上下文学习显著目标检测网络CLN-SOD），数据处理（小米专属数据集清洗），移动端移植（SNPE框架优化，提升分割精细度并减少前背景误分）。
成果：应用成功落地，自研算法有效解决背景误分痛点，提升相册产品竞争力。

机器人与IoT视觉应用（人体关键点/手势）

简介：主导小米机器狗（铁蛋）与IoT音箱视觉交互研发，实现动作控制与播放控制。
工作：人体关键点（HRNet模型训练，TensorRT/ROS端移植），手势识别（Yolov4检测+识别框架，小米专属手势库），工程优化（CUDA加速，开发ROS端后处理Pipeline与SDK）。
成果：成功落地多款智能硬件，实现人体关键点精准检测与手势实时控制。

仪表指针自动示数识别（工业巡检）

简介：燃气站机器人巡检核心视觉项目，实现仪表自动检测、分割与示数识别。
工作：数据处理（工业场景表计数据集构建），模型研发（CorNet-Lite检测，PSP指针语义分割，E2E算法数字识别），系统整合（ROS节点部署与现场联调）。
成果：示数识别准确率达98%，稳定支撑机器人自动巡检业务落地。

智能文档处理（扫描/OCR/Word转换）

简介：为Alpha Note笔记提供智能扫描、文档电子化、格式转换能力，提升办公效率。
工作：智能扫描SDK（C++跨端开发，边缘检测，多风格滤镜），PDF转Word（CTPN文本行检测，DPNet92中文字符识别，排版还原与Word导出），全流程开发（Android/iOS双平台封装）。
成果：扫描效果优于Office Lens，字符识别正确率达80%，满足专业办公需求。

成果展示

所有
语言大模型
多模态大模型
算法平台
生成大模型
视频超帧
魔法换天
人体关键点
手势识别
目标检测
语义分割
OCR
人脸检测&识别
跟踪
图像算法

|

梁增龑

教育&工作

教育经历

计算机科学与技术

电子信息工程

工作经历

高级算法专家/算法主管

高级AI应用算法研发

Expert Engineer

中级算法工程师

机器视觉算法工程师

算法工程师

算法工程师

项目经历

主题类音频推荐项目（LLM+推荐）

类别类音频推荐项目（策略优化）

内容精准投放与广告GMV提升（Multi-Agent）

工业机器人私有知识库（图文RAG）

英语作文批改与润色（LLM微调）

你画AI猜（多模态识别）

大模型基础支撑服务（Cache & RAG）

教育学科知识点命名识别（NER）

视频画质分析服务（CV/Vision Transformer）

移动端视频超帧（算法/模型移植）

小米相册魔法换天（图像分割）

机器人与IoT视觉应用（人体关键点/手势）

仪表指针自动示数识别（工业巡检）

智能文档处理（扫描/OCR/Word转换）

成果展示

|

梁增龑

教育&工作

教育经历

计算机科学与技术

电子信息工程

工作经历

高级算法专家/算法主管

高级AI应用算法研发

Expert Engineer

中级算法工程师

机器视觉算法工程师

算法工程师

算法工程师

项目经历

主题类音频推荐项目（LLM+推荐）

类别类音频推荐项目（策略优化）

内容精准投放与广告GMV提升（Multi-Agent）

工业机器人私有知识库（图文RAG）

英语作文批改与润色（LLM微调）

你画AI猜（多模态识别）

大模型基础支撑服务（Cache & RAG）

教育学科知识点命名识别（NER）

视频画质分析服务（CV/Vision Transformer）

移动端视频超帧（算法/模型移植）

小米相册魔法换天（图像分割）

机器人与IoT视觉应用（人体关键点/手势）

仪表指针自动示数识别（工业巡检）

智能文档处理（扫描/OCR/Word转换）

成果展示

英语作文批改与润色

你画AI猜

工业多模态大模型

自动标注数据平台

视频超帧率

魔法换天

仪表指针表自动示数识别

人体关键点检测

手势识别

开关检测

扫描SDK:文档边缘检测

扫描SDK:智能扫描

托盘物品检测

PDF文档转Word文档

道路区域检测

数码表自动识别

人脸检测

人脸识别

表情识别

行人跟随

去雾与增强

动态小车demo