- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
华南理工大学电信学院人机通信智能接口实验室
简要SCUT-COUCH数据格式说明手册
HCII Laboratory SCUT
华南理工大学
人机通信智能接口实验室
HYPERLINK / /
PAGE 3
华南理工大学电信学院人机通信智能接口实验室
1.SCUT-COUCH数据库详细说明
1.1.SCUT-COUCH数据文件命名规则
每套COUCH数据由两个文件名相同,扩展名不同的文件组成。扩展名分别idx和dat。其中,dat文件为实际的数据文件,idx文件是dat文件的索引文件。每个文件名(除去扩展名)的命名遵循如下格式“数据集名+下划线+编号”。其中数据集名为“Big5”,“Digit”,“GB1”,“GB2”, “Letter”,“Pinyin”,“Symbol”,“TradGB1”,“WORD17366”,“WORD44208”和“WORD8888”中的一个;编号代表该文件在相应数据集的套数编号,由三位阿拉伯数字组成。例如“WORD44208_001”代表SCUT-COUCH2009数据库中WORD44208数据集中的第1套数据,同时它包括两个文件:“WORD44208
1.2.COUCH数据文件格式
每套样本数据均由一个索引文件(扩展名为idx,我们称为IDX文件)和一个数据文件(扩展名为dat,我们称为DAT文件)组成。
1.2.1.IDX文件的格式
IDX文件格式由表1所示,IDX文件由文件头和索引单元两种结构组成。每种结构均为固定大小。
表1 IDX文件存储结构
文件头
样本0索引单元
样本1索引单元
???
样本N索引单元
IDX文件头格式如表2所示。文件头单元位于文件起始位置,只有一个long型字段,它的值等于本套数据文件存储的样本总数。
表2 IDX文件头格式
数据名
数据类型
数据长度(Byte)
描述
SampleSum
long
4
本套数据文件的样本总数
IDX文件索引单元格式如表3所示。每个样本的索引单元固定大小为13个字节,共4个数据字段。其中IDX文件中索引单元的个数与相应DAT文件中的样本数量是相同的。
表3 IDX文件样本索引单元格式
数据名
数据类型
数据长度(Byte)
描述
SampleState
unsigned char
1
Hcii-lab保留使用
OswIndex
int
4
Hcii-lab保留使用
IdxIndex
int
4
样本在本套数据中的编号,从0开始计数
DatOffset
long
4
样本数据单元在对应DAT文件中的偏移位置
1.2.2.DA文件格式
DAT文件存储结构由表4所示,由各个样本数据单元构成,每个数据单元大小不定长,具体结构如表5所示。
表4 DAT文件存储结构
样本0数据单元
样本1数据单元
样本2数据单元
???
样本N数据单元
表5 DAT文件数据单元格式
数据名
数据类型
数据长度(Byte)
描述
WordLength
unsigned char
1
样本内码长度,字节为单位
WordCode
unsigned char [ ]
WordLength×1
样本的内码
PointNum
unsigned short int
2
样本的点的个数
LineNum
unsigned short int
2
样本的笔画个数
GetTimePointNum
unsigned short int
2
捕获到时间的点的个数
GetTimePointIndex
unsigned short int [ ]
GetTimePointNum×2
捕获到时间的点的序号
ElapsedTime
DWORD [ ]
GetTimePointNum×4
每点距离上一捕获时间的采样点的时间距离
StrokeData
样本笔画数据,结构如下所示
StrokePointNum
unsigned short int
2
每笔的点数
Point(x,y)
unsigned short int
2+2
一笔中每个点的x和y的坐标值
1.2.3.IDX文件和DAT文件关系
idx文件SampleSumSampleStateOswIndexIdxIndexDatOffsetSampleStateOswIndexIdxIndexDatOffset?????????dat文件样本0数据单元
idx文件
SampleSum
SampleState
OswIndex
IdxIndex
DatOffset
SampleState
OswIndex
IdxIndex
DatOffset
???
???
???
dat文件
样本0数据单元
样本1数据单元
样本2数据单元
???
???
???
样本SampleSum-1数据单元
样本0
原创力文档


文档评论(0)