个人简介
陈颂光,1992年生。一直以来,坚持走自己的路,在现实中寻觅理想,在平淡中追求自由,让自己的学习和工作成为为自己而玩。
技术能力
- 计算机背景
- 广泛的理论储备。自学计算机系统、编译原理、操作系统、计算机网络、数据库、数据结构、模式识别、计算理论、信息安全之类的领域。
- 扎实的编程功底。十多年编程经验,兼通过程式编程、面向对象编程、函数式编程和声明式编程等范式,深入理解类型系统。不仅能在生产级项目中运用Java、BASH、Python和JavaScript等语言外,而且曾经独力在JVM上实现过几乎完全符合标准的Scheme语言解释器JSchemeMin和Prolog语言解释器JPrologMin。
- 熟知开发工具。熟悉GNU/Linux操作系统、git版本管理系统和LaTeX排版系统。能利用静态分析工具、单元测试覆盖率工具、性能分析工具、调试器和构建系统等来提高成品质量。
- 应用程序开发
- 用户界面搭建。熟练开发Android平台上的移动端应用,还有使用Swing/JavaFX搭建能够在Windows、Mac OS X和Linux上运行的跨平台桌面端应用程序。基本掌握基于HTML、CSS和JavaScript的Web前端开发。
- 后端搭建。能借助Spring Boot开发网站后端和RESTful服务。有关系型数据库以及全文检索数据仓库如Lucene/Solr的实践经验。一个个人项目是结构化数据搜索网站原型ViewFact。
- 机器学习
- 问题建模。能够基于图神经网络、循环神经网络、卷积神经网络和全连接神经网络设计合适的网络结构来解决实际问题,而它们往往不是常规的CV或NLP任务。除了深度学习外,还用过支持向量机、决策树、最近邻分类器和一些概率统计方法。曾为联机(基于笔迹)和脱机(基于图片)的手写形状/文本行/数学公式/化学结构式识别、联机手写文档版面分析、笔迹补偿预测和个性化手写文本生成等项目开发原型系统。
- 数据收集、清理和增广。除了设计数据收集/标注工具来提高效率,以及整合异构数据集以增加数据来源的多样性外,更不时采用激进的数据合成和增广策略以提高模型泛化能力或节省数据成本。
- 模型训练。除了提前停止、学习率调度、优化器/初始化方法/正规化层/激活函数选取和其它元参数调整,还包括设计辅助损失函数和迁移学习。
- 端侧模型部署与调优。有使用常见推理框架如ONNX Runtime、TensorFlow Lite和QNN在移动设备上部署神经网络模型的经验,并通过模型量化、算子融合和硬件加速等手段优化安装包大小、内存占用和速度。
教育背景
- 香港金文泰中学学生(2004-2011)
- 在多项校内考试取得第一名,包括理组年考第一名(2009-2010)、理组模拟考试第一名(2010-2011)、数学科第一名(2007-2009)、附加数学科第一名(2008-2009)、商业科第一名(2008-2009)、纯粹数学科第一名(2009-2011)、物理科第一名(2009-2010)
- 获多种校内奖项,包括但不限于勤学生奖(2009-2011)、积极学习奖(2007-2008、2010-2011)、进步生奖(2006-2008)、守时奖(2007-2011)
- 获多种校外奖项,包括但不限于最佳进步生奖(2006-2008)、香港数学竞赛初赛三等奖(2007-2008)、澳洲数学公开赛荣誉奖(2008-2009)
- 于2009-2010学年入选香港资优教育学院学员(数学)
- 在2009年香港中学会考取得三优三良成绩(数学A、附加数学A、生物A、物理B、化学C、商业C、中文3、英文3)
- 在2011年香港高级程度会考取得二优二良成绩(高级程度纯粹数学A、高级程度化学A、高级程度物理B、高级程度应用数学C、高级补充程度英语运用D)
- 在2011年港澳台联考取得543分(语文92/150、英语127/150、数学106/150、物理80/150、化学138/150)
- 在2011年中山大学对港独立招生考试取得232分(语文62/100、英语72/100、数学98/100)
- 中山大学数学与计算科学学院数学与应用数学专业本科生(2011-2015)
- 优秀学生二等奖学金(2011-2012)
- 必修课及专业选修课平均绩点为4.3,在本专业110人中排名第1
- 中山大学数学学院基础数学专业硕士研究生(2015-2017)
- 中山大学数学学院基础数学专业博士研究生(2017-2021)
- 在2017学年春季学期担任《实变函数》课程助教
- 在2018学年春季学期担任《实变函数》课程助教
- 在2019学年秋季学期担任《偏微分方程》课程助教
- 重新探讨了把脱机手写识别归结为联机手写识别的可行性,并用公开数据集上的实验数据给予正面结论,启发了一些工作。
- 提出了Sauvola、Niblack、Bernsen等局部自适应二值化方法的一种内存高效的快速实现,去掉挥霍空间的积分图像的同时还能稍为提高速度。
- 在国际模式识别学会(IAPR)主办的2019年文档分析与识别国际会议(ICDAR)联机手写数学公式识别竞赛(CROHME)中脱机识别任务荣获季军。
- 毕业论文《非光滑空间上的两个几何分析问题》在2021年获全体评阅人和答辩委员一致通过。
工作经历
- 机器学习工程师(2021年至今)
- 主导一个联机手写文档分析与识别系统的设计与实现,能够分析混合段落、表格、图片和批注的整页手写,并且可以识别其中的文字(支持超过80种语言且可以混合)、数学公式、化学结构式和形状。
- 在国际模式识别学会(IAPR)主办的2023年文档分析与识别国际会议(ICDAR)联机手写数学公式识别竞赛(CROHME)中全部三项任务(联机/脱机/双模态)任务上以压倒性优势夺冠。
- 在国际模式识别学会(IAPR)主办的2024年文档分析与识别国际会议(ICDAR)化学结构式识别竞赛(CROCS)中取得亚军,指标仅落后冠军0.61个百分点而大幅领先季军8个百分点。
如有意联系本人,可以发电子邮件到chan (AT) chungkwong (DOT) cc。