- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
生成式AI如何改变AI缺陷检测的传统范式
CONTENTS目录
01
产品背景
产生背景
01
生成式AI
02
生成式AI带来的客户价值
02
02
实现原理
实现原理
04
03
典型应用
外观缺陷检测
06
装配异常检测
06
字符异常检测
07
异物附着检测
07
04
未来展望
技术发展趋势:数据+生成式AI
08
行业应用拓展:以数据为中心的平台
08
一.产品背景
产生背景
(1)自动化和智能化对AI视觉的需求
随着自动化和智能化技术的快速发展,机器学习和视觉自动化技术在制造业中的应用越来越广泛。这些技术可以帮助企业实现自动化检测、分类、识别等任务,提高生产效率和产品质量。
但机器学习和视觉自动化技术的应用需要大量的高质量数据来训练AI模型。如果没有足够的训练数据,模型的性能将受到很大的影响。因此,如何快速、高效地获取大量多样化的数据成为了现代制造业中亟待解决的问题。
(2)当下制造业所面临的数据挑战
在当今的现代制造业中,各类厂商均面临着诸多严峻的挑战。一方面,市场竞争日益激烈,消费者对产品质量和个性化的要求不断提高。另一方面,随着自动化和智能化技术的快速发展,企业需要不断进行技术升级和创新,以保持竞争力。
然而,传统数据收集和拓增方式已经无法满足现代制造业对机器学习和视觉自动化技术的需求。
首先,传统的数据收集方式需要大量的人力、物力和时间投入。通常,企业需要对大量的产品进行实际生产、跑料拍照、人工值守才能获得缺陷样本,亦或通过人工手动破坏,从而制造缺陷。这种方式效率低下,耗时数月,且容易出现样本遗漏或错判,成本高昂。
其次,传统的数据收集方式难以在可控的时间内获得足够多样和高质量的数据来训练模型。在复杂的生产环境中,数据的多样性至关重要。不同的产品、不同的生产条件、不同的缺陷类型都需要一定量的特定数据来支撑模型的训练。但在有限时间内收集到的数据往往具有局限性,无法涵盖所有可能的NG情况,这就导致模型的泛化能力不足,难以应对实际生产中的各种变化。此外,训练数据的均衡性同样是一个重要挑战。在实际生产中,OK样本或常见NG通常远多于偶发NG样本,这种数据分布的不均衡会导致模型对NG类别的识别能力较差。例如,在缺陷检测任务中,如果训练数据中绝大多数都是常见NG和OK样本,模型可能会倾向于将偶发待检样本都判断为正常,从而降低了对缺陷的检出率。而且,数据集的缺陷质量、多样性也会影响模型性能。在数据采集过程中,可能会因为设备误差、人为错误或环境干扰等原因导致收集的训练数据标准不准确或不一致;亦或者NG数据的多样性不够(比如光照、NG位置、角度等),导致训练出来的模型对训练数据集过拟合,忽略了待检缺陷的多种形态。这些问题如果不能及时发现和纠正,将会直接影响到模型的训练效果和最终性能。
最后,基于专业图像编辑软件(例如Photoshop)的数据扩充方式需要专业人员投入大量时间制作,且高度依赖人员技能,难以保证训练数据可用性。
实时数据更新随生产环境变化定期点检,并优化数据集,确保模型有效性和准确性标注质量
实时数据更新随生产环境变化定期点检,并优化数据集,确保模型有效性和准确性
缺陷数据准确完整,保障模型学习的准确性
代表性多样性具有代表性、多样性,使模型能适应不同生产情况,提高鲁棒性
均衡性保持不同类别/形态的样本数量相对平衡,使模型学习各种缺陷样式
均衡性
保持不同类别/形态的样本数量相对平衡,使模型学习各种缺陷样式
数据量
充足的数据量提高模型泛化能力
生成式AI是一种可以创建虚拟图像内容和想法(包括局部缺陷图、带产品背景的全局缺陷图等)的AI技术。它基于大规模深度学习模型,通过分析和学习大量工业缺陷特征数据中的模式和关系,来生成原创的NG图像。生成式AI可以帮助解决传统NG数据收集和处理中遇到的多个挑战:
增加数据多样性。生成式AI可以基于有限的真实数据,生成大量的合成数据,扩充缺陷姿态的覆盖范围。平衡数据分布。生成偶发稀缺的缺陷类别样本,缓解训练数据不平衡的问题,提高模型对稀有事件的识别。
增加数据多样性。生成式AI可以基于有限的真实数据,生成大量的合成数据,扩充缺陷姿态的覆盖范围。
平衡数据分布。生成偶发稀缺的缺陷类别样本,缓解训练数据不平衡的问题,提高模型对稀有事件的识别。
提高数据质量。通过海量的预训练,模型学习缺陷之间的内在规律,进而生成高质量、一致性强的数据样本,减少训练集中的噪声和误导。
增强数据相关性。可以根据最新的生产状况及时生成新的过漏检NG,保持数据的时效性。
生成
文档评论(0)