自然语言处理技术与应用手册
第一章自然语言理解原理与基础架构
1.1词法分析与分词策略
词法分析(LexicalAnalysis)
词法分析,又称词法扫描,是自然语言处理流程的起始阶段,其核心任务是将原始文本流转换为计算机可理解的符号序列。这一过程主要执行两种操作:一是去除非语言字符(如标点符号、换行符),二是识别单词的边界。例如,在输入句子“你好,世界”中,词法分析器首先过滤掉逗号,将其视为分隔符,随后将连续的字母序列识别为独立的单词token,最终输出为“你好”、“世界”两个token。这一步骤类似于人类阅读时停顿的地方,为后续的词义理解奠定基础。
②分词策略(Tok
您可能关注的文档
最近下载
- 水利工程施工表格及报审表.pdf VIP
- 上海市松江区2024-2025学年五年级下册期末考试语文试卷(有答案).pdf VIP
- 2025年沪教版地理六年级第二学期期末考试试卷.pdf VIP
- 上海市六年级地理2025年下册期末考试完整试卷.pdf VIP
- 2026年安全生产月启动大会PPT课件.pptx VIP
- 小班语言:画一画活动课件.ppt VIP
- ASTM A312_A312M-25 中文版(无缝和焊接奥氏体不锈钢管标准).docx VIP
- 人工智能 智能体互联 第1部分:总体架构.pdf VIP
- 2026年北京市昌平区初三二模英语试卷(含答案).pdf
- 2024年高考(福建卷)地理真题(学生版+解析版).docx
原创力文档

文档评论(0)