|

我叫梁增龑 我是一名资深AI算法程序员 我来自中国
工龄 : 10
学历 : 硕士
坐标 : 北京
邮箱 : Lzy_Lyx@163.com
项目 展示

本人目前任职于新浪微博,10年互联网算法领域深耕经验,现任算法团队负责人(带5人)。精通深度学习类算法,对大模型、推荐、自然语言、视觉、视频领域算法均有掌握,擅长将算法模型落地到实际业务。主导多项核心算法项目,带领团队完成算法优化、模型迭代,推动各项核心指标大幅提升。具备完整的团队管理经验,擅长团队敏捷开发,打造高效协作的算法团队,兼顾技术深度与业务价值。工作至今,已累计申请算法发明专利21项。

近三段工作成果是:

  • 主导主题音频推荐算法项目,完成算法发明专利3项;开展1周AB实验(放量50%),实现点击PV提升12%、点击UV提升6.76%、播放时长提升5.51%、播放UV提升0.52%、播放VV提升31.17%;长期优化后,ctr数据从3月份均值1.3%提升至6月份均值1.9%,同比提升46%,显著提升音频推荐转化效率。
  • 主导分类音频推荐算法项目,完成算法发明专利2项;开展1周AB实验(放量50%),实现点击PV提升9.91%、点击UV提升6.85%、播放时长提升5.61%、播放UV提升0.64%、播放VV提升19.89%;下半年承接音频项目KR指标,将推荐定量指标由ctr转为音频播放页时长,Q4音频播放页平均时长达9.7万分钟,指标完成率82%,达成业务核心目标。
  • 主导算法团队与产品、工程、业务部门的协同,推动算法需求拆解与落地,实现技术与业务的深度绑定,获得业务方高度认可。
  • 猿辅导时期,主导的英文作文批改、多模态项目你画AI猜、作业美化项目均已投入使用,期间完成12项算法发明专利。
  • 小米时期,首次突破移动端视频超帧算法,打破端侧只能利用芯片进行超帧的壁垒,原创超帧算法在相关数据集测试达到state of the art水平,期间完成6项算法发明专利。

个人技能

  • 大模型与智能体
    框架:熟练使用 AutoGen、LangChain、LlamaIndex、LiteLLM 构建多智能体协作系统;
    训练与推理:精通 Transformers、TRL、Llama-factory、PEFT、DeepSpeed 微调及 vLLM 高性能推理加速;
    前沿技术:深入理解 ReAct 思考链,具备 MCP 及 RAG 实战经验。
  • 核心算法与框架
    深度学习:精通 PyTorch(曾编写知乎《Pytorch教程》)、TensorFlow 框架;
    领域积累:深入掌握推荐算法(召回/排序)、NLP(实体识别/翻译/语义)、CV(多模态/超帧/检测/分割/跟踪/OCR);
    传统算法库:熟练使用 OpenCV、Scikit-learn、NLTK、FFmpeg 等工具。
  • 算法工程部署与端侧推理
    高性能部署:熟练使用 Triton、TensorRT、CUDA、OpenCL 核函数编程;
    后端开发:FastAPI、Flask、NextJS、Spring Boot 及 RPC 协议,掌握 Make/CMake 构建体系;
    大数据存储:Milvus/Faiss 向量数据库、ES、Spark、Hive、MySQL、Redis;
    中间件与容器:Docker 容器化、Kafka、Nginx,掌握 RabbitMQ、Celery 分布式任务调度;
    端侧迁移:熟练使用 ONNX、LibTorch、SNPE、NCNN、MACE 等移动端推理框架。
  • 编程语言
    精通:Python, C/C++, Shell; 熟悉:Java, JavaScript, C#
  • 资质与影响力
    职称荣誉:人工智能中级职称(中科院);
    技术成果:累计获得 27 项算法发明专利;知乎专栏《AI编程教程:Pytorch》作者;
    个人网站:liangzengyan.cn

教育&工作

教育经历

2012 - 2015

计算机科学与技术

贵州大学 硕士

2007 - 2011

电子信息工程

成都信息工程大学 本科

工作经历

2024.11 - 至今

高级算法专家/算法主管

新浪微博

2022.11 - 2024.7

高级AI应用算法研发

猿辅导

2022.5 - 2022.11

Expert Engineer

虾皮

2020.4 - 2022.5

中级算法工程师

小米

2019.2 - 2020.3

机器视觉算法工程师

眸视科技

2018.1 - 2019.1

算法工程师

新橙科技

2016.7 - 2017.9

算法工程师

华尚高新

项目经历

主题类音频推荐项目(LLM+推荐)

简介:负责微博音频推荐全流程算法研发,解决精准召回、个性化排序及高并发部署问题,支撑业务指标提升。
工作:数据工程(Spark/Hive拉取,LLM生成主题/关键词,Milvus向量存储),召回策略(Jina V4向量检索,热搜词冷启动),模型优化(Qwen3-14B,创新引入MoE-LoRA架构),精排优化(ONN-Sparse改进,专家门限机制),工程部署(Triton服务,Redis异步Pipeline)。
成果:申请算法专利3项;AB实验点击PV提升12%,播放VV提升31.17%,CTR提升46%。

类别类音频推荐项目(策略优化)

简介:主导类别类音频推荐算法研发,聚焦音频分类、排序策略及展位动态调整,提升用户留存与消费体验。
工作:音频分类(LLM对ASR内容打标,Crontab自动更新),排序策略(多因子加权,展位分段策略,周榜更新机制),偏好匹配(Jina V4向量匹配),动态展位(智能体Agent动态配置策略),体验优化(同作者去重,块分割随机扰动),工程部署(Redis异步Pipeline)。
成果:申请算法专利2项;AB实验点击PV提升9.91%,Q4音频播放时长完成率82%。

内容精准投放与广告GMV提升(Multi-Agent)

简介:以多智能体(Multi-Agent)技术为核心,实现用户意图与内容/广告的精准匹配,突破传统投放效率瓶颈。
工作:架构设计(基于AutoGen框架,遵循ReAct范式),核心技能(用户意图识别、内容检索、广告主题匹配),召回策略(Milvus两步召回:粗召回+意图细召回),工程部署(MCP服务托管,实现智能体技能自动化触发与调度)。
成果:AI创新项目,方法被搜索部采纳,申请算法专利2项,有效提升留存率与广告GMV。

工业机器人私有知识库(图文RAG)

简介:负责工业机器人私有知识库全栈搭建,以RAG技术为核心,打造图文并茂的高效检索体系。
工作:平台搭建(React + FastAPI,多级目录管理),多尺度检索(BGE-M3模型,LlamaIndex解析PDF/Docx图片与文本),重排优化(BGE-reranker-base),图文创新(Milvus存储切片与图片位置关联,实现检索结果图文同步渲染),数据闭环(全流程自动处理)。
成果:平台全功能上线,使相关文档检索效率提升60%以上,显著提升文档阅读体验。

英语作文批改与润色(LLM微调)

简介:飞象星球学生端核心产品,利用大模型技术提升学生英语写作能力,优化产品体验。
工作:数据工程(采集清洗,GT制作,JSON生成),提示词工程(评分、纠错、润色三大模块,迭代7个版本),模型微调(Llama2-7B-Chat,LoRA微调,FP16),性能优化(LoRA融合,vllm推理加速,TP=2),工程部署(双机房RPC服务,V100-32G)。
成果:产品成功落地,实现批改润色全流程自动化,获得用户广泛认可。

你画AI猜(多模态识别)

简介:飞象双师课堂欢迎产品,通过多模态技术实时识别学生绘画作品,激发对AI的探索兴趣。
工作:数据工程(Quick_Draw数据集筛选,图文对制作),模型优化(Clip-Vit-32基座,Wise-ft方法冻结Backbone微调线性层),性能优化(文本向量库分组,模型预热Warmup,QPS=19.97),工程部署(RPC服务,Console云平台)。
成果:申请算法专利1项,实现多模态技术在教育场景的成功落地。

大模型基础支撑服务(Cache & RAG)

简介:整合大模型缓存与RAG服务,为公司解题、作文、双师AI等多个产品提供底层技术支撑。
工作:缓存服务(Faiss-GPU框架,多节点同步策略,时序向量数据库管理多轮对话),RAG服务(LangChain框架,文档同ID多段拆分,Faiss检索加速,QPS=20),统一部署(RPC服务,双机房高可用架构)。
成果:累计申请专利2项,缓存服务显著降低海外模型使用成本,达成降本增效目标。

教育学科知识点命名识别(NER)

简介:负责学科图谱知识点扩增,提升图谱覆盖度与细粒度,支撑个性化复习场景落地。
工作:数据工程(题目采集清洗,GT制作),提示词与微调(Aton-7B-Chat基座,LoRA微调,FP16),性能优化(vllm推理加速,QPS=2),生成策略(流式输出+贪婪检索),后处理(知识点去重与图谱校验),工程部署(双机房V100)。
成果:显著提升知识点细粒度,实现知识点识别、生成、筛选全流程自动化。

视频画质分析服务(CV/Vision Transformer)

简介:全流程研发画质分析SDK,精准识别增强效果不佳的Badcase,支撑视频增强算法迭代。
工作:框架搭建(C++开发画质分析SDK),内容理解(集成三明治检测与人脸检测),画质评判(Vision Transformer - MUSIQ模型训练,SPAQ/SPV数据集微调),核心指标(PLCC达93.2%,Badcase召回率83%)。
成果:服务成功落地,实现每日增强视频自动化分析,有效支撑算法快速迭代。

移动端视频超帧(算法/模型移植)

简介:小米手机视频播放器核心插件,实现2倍超帧功能,提升视频播放流畅度。
工作:算法研发(基于AdaCoF训练,自研多尺度运动信息插帧网络VFI-FMSMI),移动端移植(SNPE/MACE框架适配,OpenCL自定义算子实现),优化处理(光流校正,场景切换精准判断)。
成果:算法达到State-of-the-art水平,自研算法有效解决高分辨率视频插帧痛点。

小米相册魔法换天(图像分割)

简介:负责小米手机相册核心应用研发,实现拍照天空区域的快速、精准分割与替换。
工作:模型研发(基于U2Net训练,自研上下文学习显著目标检测网络CLN-SOD),数据处理(小米专属数据集清洗),移动端移植(SNPE框架优化,提升分割精细度并减少前背景误分)。
成果:应用成功落地,自研算法有效解决背景误分痛点,提升相册产品竞争力。

机器人与IoT视觉应用(人体关键点/手势)

简介:主导小米机器狗(铁蛋)与IoT音箱视觉交互研发,实现动作控制与播放控制。
工作:人体关键点(HRNet模型训练,TensorRT/ROS端移植),手势识别(Yolov4检测+识别框架,小米专属手势库),工程优化(CUDA加速,开发ROS端后处理Pipeline与SDK)。
成果:成功落地多款智能硬件,实现人体关键点精准检测与手势实时控制。

仪表指针自动示数识别(工业巡检)

简介:燃气站机器人巡检核心视觉项目,实现仪表自动检测、分割与示数识别。
工作:数据处理(工业场景表计数据集构建),模型研发(CorNet-Lite检测,PSP指针语义分割,E2E算法数字识别),系统整合(ROS节点部署与现场联调)。
成果:示数识别准确率达98%,稳定支撑机器人自动巡检业务落地。

智能文档处理(扫描/OCR/Word转换)

简介:为Alpha Note笔记提供智能扫描、文档电子化、格式转换能力,提升办公效率。
工作:智能扫描SDK(C++跨端开发,边缘检测,多风格滤镜),PDF转Word(CTPN文本行检测,DPNet92中文字符识别,排版还原与Word导出),全流程开发(Android/iOS双平台封装)。
成果:扫描效果优于Office Lens,字符识别正确率达80%,满足专业办公需求。