- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
积厚扫描图像校正.pdf
第
17
卷 第
1
期
2005
年
1
月
计算机辅助设计与图形学学报
JOURNAL OF COMPUTER AI DED DESI GN COMPUTER GRAP ICS
Vol. 17
,
No. 1
Jan.
,
2005
收稿日期:
2003 07 28
;修回日期:
2003 11 04
基金项目:国家“八六三”高技术研究发展计划(
2001AA231031
);国家科技攻关计划课题奥运科技专项(
2001BA904B08
);国家重点基础研究
发展规划(
G1998030608
);中国科学院计算技术研究所青年创新基金(4
)
积厚文档扫描图像校正
向世明1,2) 赵国英1,2) 陈 睿1,2) 贾富仓1,2) 李 华1)
1
)(中国科学院计算技术研究所智能信息处理重点实验室 北京
100080
)
2
)(中国科学院研究生院 北京
100039
)
(
smxian
g
!ict . ac. cn
)
摘 要 扫描已装订的积厚文档时,由于页面不能紧贴于扫描平面,会产生两个问题:(
1
)扫描图像中离装订线较近
的一侧出现黑色的阴影区域;(
2
)阴影区域中的文本产生扭曲
.
基于图像信息和几何变形信息,提出一种去除阴影和
校正文本的算法
.
首先采用分块自动阈值算法去除阴影;然后通过垂直投影函数、有效包围盒和标记点提取文本行
中心线,中心线被用于全局几何参数的估计;最后,扭曲的文本通过估计的几何参数和分片四边形映射进行校正
.
实
验结果表明该算法能给出较好的校正结果
.
关键词 积厚文档;文本行中心线;垂直投影函数;有效包围盒;标记点;几何参数
中图法分类号
TP391
Restoration of l ma
g
es scanned from thick Bound Documents
Xian
g
Shi mi n
g
1
,
2
)
Zhao Guo
y
i n
g
1
,
2
)
Chen Rui
1
,
2
)
Jia Fucan
g
1
,
2
)
Li ua
1
)
1
)(
Ke
y
Laborator
y
o
f
I ntelli
g
ent I n
f
or mation processin
g
,
I nstit ute o
f
Com
P
utin
g
Technolo
gy
,
Chinese acade m
y
o
f
Sciences
,
Bei
j
in
g
1000800
)
2
)(
Graduate School o
f
t he Chinese acade m
y
o
f
Sciences
,
Bei
j
in
g
100039
)
Abstract While scanni n
g
t hick bound documents
,
t he
p
a
g
es are not flat on t he document
g
lass of t he
scanner. The
p
h
y
sical def or mation of t he scanned
p
a
g
e can results i n t wo ki nds of de
g
radation f or t he
scanned i ma
g
e. One is t he shadow i ncurred near t he s
p
i ne of t he book
;
and another is t he text bei n
g
bended. I n t his
p
a
p
er
,
we
p
ro
p
ose a method to combi ne t he i nf or mation both f rom the scanned i ma
g
e and
fromthe
g
eometric distortion to remove t he shadow as well as restore t he war
p
ed words to t he ri
g
ht
p
ositions. First
,
t he shadowis removed b
y p
atch- based auto-t hreshold bi narization. Then the central li nes of
text are directl
y
extracted f rom the bi narization i ma
g
e. This
g
oal is achieved b
y
usi n
g
vertical
p
ro
j
ection
f unction
,
vali d boundi n
g
boxes
,
and markers. Fi nall
y
文档评论(0)