《人工智能(二十)》青少年教育丛书.pdfVIP

  • 5
  • 0
  • 约1.99万字
  • 约 12页
  • 2017-10-29 发布于浙江
  • 举报

《人工智能(二十)》青少年教育丛书.pdf

下载 第2 0章 用贝叶斯网学习和动作 20.1 学习贝叶斯网 学习一个贝叶斯网的问题是寻找一个网络,它能最好地匹配(按照某个记分度量)一个数 据训练集(training set ) ,是所有(至少有一些)变量值的实例集合。说“寻找一个网”, 我们的意思是既要找到D A G 结构,也要找到与D A G 中每个节点相关的条件概率表(C P T )。 20.1.1 已知网络结构 如果知道网络的结构,那么只需找到 C P T ,我们首先描述这种情况。通常,人类专家能对 一个问题领域提出适当的结构但不能做出 C P T 。在我们必须学习网络结构的情况下,学习 C P T 仍是必需的。学习C P T有一个比较容易的和一个比较难的两种情况。在容易的情况下,没有缺 失的数据,即训练集合 的每个成员对网中表达的每个变量有一个值。然而在更实际的设置中, 情况常常是一些训练记录的变量值缺失了;缺失的数据导致更难以学习 C P T 。 1. 无缺失数据 首先假定没有缺失任何数据。这里,如果 有充足的训练样本,我们只要计算每个节点和 它的双亲的采样统计信息。假如给定双亲 (V ), 我们想得到某个节点 V 的C P T 。遵守前面 i i 的约定,我们用v 指称V 的值。V 的表和它具有 i j i 的不同值(小于 1)一样多。在布尔表达式中, 实例数 再次假定,对每个节点仅有一个 C P T 。设V 有k i i 个父节点。因为每个双亲有两个可能值,那么 k 在表中有 2 i 项(行)。我们用向量变量P 指称与 i V 的双亲有关的变量,用向量值 P 指称这些变 i i ˆ 量的值。采样统计结果 p ( V = v | P = p ) ,由 i i i i 中有V = v 和P = p 的采样数除以有P = p 的 i i i i i i 采样数得到。为了学习 C P T ,我们仅仅将实际 图20-1 一个网络和一些示例值 的这些采样统计结果用于网中的所有节点。 用一个例子可以使这个计算更清楚。考虑一个同图 1 9 - 2有相同结构的贝叶斯网,在图 2 0 - 1 中重复它,但没有C P T 。假如我们观察了图中G、M、B和L的1 0 0组值(注意到有些组合没有出 ˆ 现,有些比其他出现得更频繁)。为了计算采样概率p (B = Tru e) ,我们只要计算在所有的采样 ˆ ˆ 中B为Tru e 出现的次数。得到p ( B = T r u e)= 0.94 。同样,p ( L = T r u e) = 0.68 。对节点B和L, 这些概率正是它们的C P T所需

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档