wang guosong's resume - 核心算法负责人 | 多模态医疗报告生成系统优化

wang guosong

核心算法负责人 | 多模态医疗报告生成系统优化

Nanchang

Summary

An aspiring machine learning intern with a strong academic background and practical experience in deep learning, model optimization, and data processing. Seeking a challenging internship opportunity to apply and enhance skills in large-scale deep learning model training and optimization.

Education

南昌大学硕士研究生, 计算机科学与技术 Grade : 考研总分专业第一、学业奖学金一等奖、2025年“华为杯”全国研究生数学建模竞赛三等奖 Sep 2025 - Present
江西财经大学本科, 经济学 Sep 2021 - Jun 2025

Experience

核心算法负责人多模态医疗报告生成系统优化 Feb 2026 - Present • 6 mos

• 数据流转与训练链路:独立处理 20万份 MIMIC-CXR 数据并搭建多模态训练框架,完成数据清洗、样本组织、实验管理与版本跟踪。 • 训练效率优化:提取Rad-DINO 视觉特征后,在 MLP 映射层引入平均池化,将视觉特征压缩为8×8(64 Tokens) 输入 Qwen2.5-0.5B,降低训练显存占用并提升训练可行性。 • 先验提示与解耦训练:构建分类器预测 CheXbert 14 类疾病标签,并转化为 Token 作为大模型先验 Prompt; 训练中采用解耦策略(阻断LLM 梯度回传至分类器),使分类器 F1 达60%。 • 训练策略与资源调度:在单卡 PRO6000(96G)限制下,仅解冻 Qwen 后12层进行局部 SFT(显存控制在 40G);设计句级采样对齐方案,基于 RadGraph 提取 1-F1 幻觉率,筛选约 10 万对偏好样本进行 DPO。 • 评估闭环与协作交付:模型在 MIMIC-CXR上CheXbert-P/R/F1达0.62/0.45/0.52,关键指标超越当前 SOTA; 代码基于 Git 全流程管理,跑通核心链路后完成团队交接。
第二作者遮挡车辆重识别(ReID)多任务预训练研究 Nov 2025 - Present • 9 mos

• 科研产出与结果:完成论文《Unified Multi-task Vision Language Pre-training for Occluded Vehicle Re-identification in the Wild》(在投 IEEE TETCI); 模型在 VeRi-776 上取得 mAP 89.8%、Rank-1 97.4%,mAP 较此前 SOTA 提升6.2%。 • 大规模样本处理:结合 VeriWild 与 SAM2 提取的障碍物 Mask,基于物理位置与视角关系独立合成并清洗出 180万图像、40,671 ID 的高仿真遮挡 ReID 数据集。 • MAE 视角重构:复用SAM 分割获取的车辆4个局部视角先验(前/后/侧/顶),将 MAE 任务扩展为像素级视角分类(5分类),引导模型隐式学习车辆的 3D 几何与视角感知能力。 •基于 CoCoOp 的图文对齐:提取车辆前景特征,通过 MLP 与可学习参数融合生成动态文本提示将提示输入文本编码器后与视觉特征进行对比学习,训练过程中仅优化 Prompt、MLP 及视觉主干。 • 特征自蒸馏与评估:引入旋转视图特征与原图 CLS Token 的自蒸馏损失,增强模型对复杂视角变化的旋转不变性与鲁棒性,并通过 mAP/Rank-1 指标进行方案对比评估。

Skills

机器学习训练与优化
Expert
特征与样本处理
Expert

Languages

中文
Native speaker
English
Native speaker