- 0
- 0
- 约1.78万字
- 约 115页
- 2017-03-09 发布于上海
- 举报
スライド 1 Jins HP滑动1 仁 s HP
コーパスデータの統計解析 10月6日 立教大学 コーパスデータ解析 目次 統計とは? コーパスデータ Rの入門 コーパスの統計解析 簡単な計算、グラフ 仮説検定(平均の差の検定、クロス表の検定) コーパス内のパターン分析(主成分分析など) 言語要素の変化の傾向分析ーー回帰分析 コーパスのパターンの識別ーー判別分析 統計とは? 「集団における個々の要素の分布を調べ,その集団の傾向?性質などを数量的に統一的に明らかにすること.また,その結果として得られた数値.」(広辞苑第五版) 集団を母集団と呼ぶ 集団から抽出した要素の集合を標本と呼ぶ 標本の抽出をサンプリングと呼ぶ 標本のデータを分析する ? 記述統計 標本データから母集団の性質を推測?記述統計 データ解析 記述統計の主な方法 記述統計量(平均、分散、分位数、尖度、歪度…) データの図示(棒グラフ、ヒストグラム、箱ひげ図…) 主成分分析、因子分析、対応分析、多次元尺度法、クラスター分析… 推測統計の主な方法 区間推定と仮説検定(区間推定、平均?比率などの検定、クロス表の検定…) 回帰分析(線形回帰、非線形回帰、機械学習…) 判別分析(線形判別、非線形判別、機械学習…) ベイズモデル、ブートストラップ法など 目的と分析方法 コーパスの特徴分析 比率、代表値、主成分分析など記述統計法 コーパス間の差異の比較分析 指標の比較、仮説検定を中心とした推測統計法 言語要素の経年の変化 回帰分析法、機械学習法など コーパスのパターンの識別 判別分析法、機械学習法など データ解析?マイニングとツール Excel SAS、 SPSS、 S-PLUS R Rの作業画面 演習1 パッケージ Rはもっとも基本的な環境+パッケージ パッケージは既に2000以上 パッケージの操作 ① インストール、② 読み込み パッケージの分類 ① インストール済み 読み込み操作不要 読み込み操作が必要 ② インストールが必要 ローカルにダウンロードしてインストール データの入出力 ベクトル vector, c マトリクス matrix データフレーム data.frame リスト list データの編集 edit, fix データファイルからの入力 read.table read.csv 出力 write.table write.csv 演習2 パッケージe1071を探し、D:/tempにダウンロード?保存し、インストール、読み込みを行いなさい Helpを使いましょう メニュー「ヘルプ」 基本演算と基本統計量 算術演算 比較演算 論理演算 行列演算 固有値 特異値の分解 基本統計量(平均、分散、??????) データの視覚化 棒グラフ barplot 円グラフ pie ヒストグラム hist 折れ線グラフ matplot 箱ひげ図 boxplot 散布図(2次元、3次元) plot, pairs その他 代表値 平均mean 分散var,標準偏差sd 平方根sqrt 相関係数cor 合計sum 比率 mean(X[1,]) var(X[1,]);sd(X[1,]) sqrt(X) cor(X) sum(X[,1]) prop.table(x[,1]) 箱ひげ図boxplot help(boxplot) boxplot(count ~ spray, data = InsectSprays) 量的データの場合 身長、成績、製品のサイズ(直径、長さなど) 計測データをヒストグラムで示すことができる 確率分布関数(probability distribution function) 確率分布 正規分布確率密度関数dnorm 正規分布の乱数 関数rnorm 正規分布の確率分布関数pnorm 標準正規分布の2の確率を求めなさい。 正規分布の確率分位点qnorm 標準正規分布の下側2.5%の点 標準正規分布の上側2.5%の点 幾つかの離散分布 二項分布 (d,p,q,r) binorm ポアソン分布 (d,p,q,r) pois 幾何分布 (d,p,q,r) geom 超幾何学分布 (d,p,q,r) hyper 多項分布 (d,p,q,r) multinom 負の二項分布 (d,p,q,r) nbinom 主な連続型確率分布 一様分布 (d,p,q,r) unif 正規分布 (d,p,q,r) norm 指数分布 (d,p,q,r) exp T分布 (d,p,q,r) t F分布 (d,p,q,r) f カイ2乗分
您可能关注的文档
- World War II Dates to Remember Kentucky Academy 第二次世界大战纪念日肯塔基学院.ppt
- World War II and PostWar Europe Indiana University第二次世界大战和战后欧洲印第安那大学.ppt
- World War II and its Aftermath waupaca第二次世界大战及其后果沃帕卡.k12.wi.us.ppt
- World War II Review GST BOCES二战回顾GST董事.ppt
- WorldCom and Journal Entries SLU世通和日记圣路易斯.ppt
- World War II European Theater sgasd二战欧洲战场 sgasd.ppt
- Worldwide Volkswagen University of Missouri–Kansas 全世界大众密苏里堪萨斯大学堪萨斯.ppt
- WORM COMPOSTING OR VERICOMPOSTING City of 蠕虫堆肥或vericomposting市.ppt
- WORN OUT磨损. PLAY ON. mcwilsurfaces.ppt
- Wortstellung Word Order classes语序语序类.uleth.ppt
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 传媒法规与伦理教学课件(共22章)新闻伦理研究综述.pdf VIP
- 汽车行驶记录仪产品使用说明书.PDF VIP
- 2026年成都市美容医疗诊所医美项目安全规范运营可行性研究报告.docx VIP
- ocean培训petrel re快速入门工作流程.pdf VIP
- (四年级奥数班讲义.doc VIP
- 单病种病案数据填报指导手册.doc
- 企业 IPO 筹备方案(最新版,附时间表 + 材料).docx VIP
- 深圳初三数学联考模拟试题.docx VIP
- 高考历史二轮总复习精品课件 第四板块 世界现代史 第十七讲 现代科技的发展与当今世界发展的趋势.ppt VIP
- 2024年菏泽职业学院单招数学考试模拟试题及答案解析.docx VIP
原创力文档

文档评论(0)