- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据格式说明手册
简要SCUT-COUCH数据格式说明手册
HCII Laboratory SCUT
华南理工大学
人机通信智能接口实验室
/
1.SCUT-COUCH数据库详细说明
1.1.SCUT-COUCH数据文件命名规则
每套COUCH数据由两个文件名相同,扩展名不同的文件组成。扩展名分别idx和dat。其中,dat文件为实际的数据文件,idx文件是dat文件的索引文件。每个文件名(除去扩展名)的命名遵循如下格式“数据集名+下划线+编号”。其中数据集名为“Big5”,“Digit”,“GB1”,“GB2”, “Letter”,“Pinyin”,“Symbol”,“TradGB1”,“WORD17366”,“WORD44208”和“WORD8888”中的一个;编号代表该文件在相应数据集的套数编号,由三位阿拉伯数字组成。例如“WORD44208_001”代表SCUT-COUCH2009数据库中WORD44208数据集中的第1套数据,同时它包括两个文件:“WORD44208_001.idx”和“WORD44208_001.dat。
1.2.COUCH数据文件格式
每套样本数据均由一个索引文件(扩展名为idx,我们称为IDX文件)和一个数据文件(扩展名为dat,我们称为DAT文件)组成。
1.2.1.IDX文件的格式
IDX文件格式由表1所示,IDX文件由文件头和索引单元两种结构组成。每种结构均为固定大小。
表1 IDX文件存储结构
文件头 样本0索引单元 样本1索引单元 ((( 样本N索引单元
IDX文件头格式如表2所示。文件头单元位于文件起始位置,只有一个long型字段,它的值等于本套数据文件存储的样本总数。
表2 IDX文件头格式
数据名 数据类型 数据长度(Byte) 描述 SampleSum long 4 本套数据文件的样本总数
IDX文件索引单元格式如表3所示。每个样本的索引单元固定大小为13个字节,共4个数据字段。其中IDX文件中索引单元的个数与相应DAT文件中的样本数量是相同的。
表3 IDX文件样本索引单元格式
数据名 数据类型 数据长度(Byte) 描述 SampleState unsigned char 1 Hcii-lab保留使用 OswIndex int 4 Hcii-lab保留使用 IdxIndex int 4 样本在本套数据中的编号,从0开始计数 DatOffset long 4 样本数据单元在对应DAT文件中的偏移位置
1.2.2.DA文件格式
DAT文件存储结构由表4所示,由各个样本数据单元构成,每个数据单元大小不定长,具体结构如表5所示。
表4 DAT文件存储结构
样本0数据单元 样本1数据单元 样本2数据单元 ((( 样本N数据单元
表5 DAT文件数据单元格式
数据名 数据类型 数据长度(Byte) 描述 WordLength unsigned char 1 样本内码长度,字节为单位 WordCode unsigned char [ ] WordLength×1 样本的内码 PointNum unsigned short int 2 样本的点的个数 LineNum unsigned short int 2 样本的笔画个数 GetTimePointNum unsigned short int 2 捕获到时间的点的个数 GetTimePointIndex unsigned short int [ ] GetTimePointNum×2 捕获到时间的点的序号 ElapsedTime DWORD [ ] GetTimePointNum×4 每点距离上一捕获时间的采样点的时间距离 StrokeData 样本笔画数据,结构如下所示 StrokePointNum unsigned short int 2 每笔的点数 Point(x,y) unsigned short int 2+2 一笔中每个点的x和y的坐标值
1.2.3.IDX文件和DAT文件关系
图1显示IDX文件和DAT文件的关系。IDX文件中每个样本索引结构中的DatOffset字段的值等于该样本数据单元在DAT文件中的偏移量,以字节为单位,从文件开头算。
图2 idx文件与dat文件关系图
1.2.4.正确读取COUCH数据
读取IDX文件
IDX文件为COUCH数据的索引文件,通过读取IDX文件中的索引单元,可以快速获取应样本的信息和该样本的数据单元在dat文件中的位置。读取IDX文件时,必须先读取IDX文件头(格式详见表2),以获取本套数据的样本总个数。IDX文件中每个样本索引单元结构大小固定为13个字节(格式详见表3),因此可以方便快速读取到目标索引结构。
读取DAT文件
DA
您可能关注的文档
最近下载
- 型钢悬挑卸料平台监理实施细则.doc VIP
- 2025版最新建设工程强制性条文汇编.pdf VIP
- (高清版)DG∕TJ 08-2105-2022 行道树栽植与养护技术标准.pdf VIP
- 无人机组装与调试:多旋翼无人机飞控系统组装调试PPT教学课件.pptx VIP
- 检验检测机构资质认定质量手册和程序文件(质量记录表格汇编).doc VIP
- 建筑机电安装培训.pptx VIP
- 初三物理课件第十六章 3节 电阻课件初三物理课件第十六章 第3节 电阻课件.ppt VIP
- 低空经济产业园招商引资与项目管理.docx VIP
- 燃气经营安全重大隐患判定标准课件.pptx VIP
- 2025年学校基孔肯雅热防控工作预案(精选模板).docx
文档评论(0)