OPT OpenIR  > 研究生部
基于FPGA的实时瞳孔定位技术研究
吴孟杰
学位类型硕士
导师宋宗玺
2016-05-17
学位授予单位中国科学院大学
学位授予地点北京
关键词瞳孔 Fpga 最小二乘法 Ransac
摘要瞳孔的实时检测定位是眼球视线追踪领域的一个重要技术,通过检测眼睛的
瞳孔位置建立模型判断出视线方向和观察落点,达到以眼睛来操控和交流的目的,
在医疗、虚拟现实、UI 设计等多个领域大有用处。
准确地检测视线方向,需要高速捕捉眼睛的运动轨迹,直接导致了后端庞大
的计算量,另外眼睛的检测受到了外界光照环境、佩戴眼镜、睫毛、眉毛、头发
及其他个体不可预知性的面部特征等外界因素的干扰,严重地影响系统算法的准
确度。因此,瞳孔定位的实时性和准确性是视线追踪面临的一个重大挑战。
本文以帮助渐冻人以眼交流为背景,设计了高速CMOS 相机,在保持和一般
商用30 帧[8,9,41] 几乎相同的速率情况下,将分辨率从640×480 提升至1024×768,
更加准确的记录下眼睛的运动过程。利用FPGA 的优良的逻辑控制和高速接口特
性,实现快速读出、存储并传输高速图像数据的功能。
人眼图像采用预处理之后,采用算法拟合眼睛瞳孔的边缘以求得中心坐标等
信息。本文在最小二乘法(LSM)、最小二乘法和RANSAC 迭代法(LR)基础上做出
了改进,将迭代遍历所有点改进为迭代少量特征点,减少了迭代计算量,加快了
运行速度,通过实验数据比较三种算法的时效性和准确性得出最优的算法。实验
发现, LR 算法、 FPLR 均使得拟合精度提升,LR 需要经过至少6 次迭代,FPLR
仅需要3 次,可使得椭圆拟合准确率超过90%, FPLR 每秒处理27 帧图像,比
LR 算法提升了至少200%。
整体设计上,硬件设计方面有高速率、多电平、差分单端混合、多板层要求,
Verilog HDL 编程上状态复杂、时序严格,算法兼具准确性和鲁棒性的特点,使得
毕设整体具有较深的设计难度和很大的工作量,决定了本课题无论是至于科研还
是应用都有很强的实际意义。
学科领域电子、电信技术
语种中文
文献类型学位论文
条目标识符http://ir.opt.ac.cn/handle/181661/27955
专题研究生部
作者单位中国科学院西安光学精密机械研究所
推荐引用方式
GB/T 7714
吴孟杰. 基于FPGA的实时瞳孔定位技术研究[D]. 北京. 中国科学院大学,2016.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于FPGA的实时瞳孔定位技术研究.pd(3731KB)学位论文 限制开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[吴孟杰]的文章
百度学术
百度学术中相似的文章
[吴孟杰]的文章
必应学术
必应学术中相似的文章
[吴孟杰]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。