专题讨论二资料挖掘于网际空间中之地理参照资讯Data Mining ....ppt

专题讨论二资料挖掘于网际空间中之地理参照资讯Data Mining ....ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专题讨论二资料挖掘于网际空间中之地理参照资讯Data Mining ...

專題討論二 資料挖掘於網際空間中 之地理參照資訊 Data Mining Georeferenced Information in Cyberspace 指導老師:朱 子 豪 評閱老師:孫 志 鴻 評閱同學:許 秋 玲 報告學生:曾 偉 綸 2001/04/10 一、研究動機 資訊與通訊科技迅速發展 由網際網路提供的各式各樣的服務所架構出來的『網際空間』(cyberspace) 網際空間中的地理 (grographies of cyberspace) 二、研究目的 網際空間上的服務和活動多和實體空間上的重疊或取代,而活動本身的地理資訊是否也嵌入網際空間中。 在這資訊超載且無結構化的網際空間中,如何能找出並有效利用現存的資訊 本研究目的分成兩個部分: 第一部份:挖掘出嵌入在網際空間的地理參照資訊(Georeferenced Information)。 DOTGEO定義地理參照資訊為表現地理座標資訊位置、地方或物件的資訊。 第二部分:將抽取出來的地理參照資訊嘗試作傳統地理資訊分析,如空間分析、市場分析等應用。 這裡列出幾個可能的應用分析: 加強電子商務的服務:統計使用者於伺服器端所要求之服務或查詢的關鍵詞,找出某項服務在某區為的需求量最大。 增加搜尋引擎的正確性:傳統搜尋引擎是以此網頁被連結的次數作為排名的標準。但針對某些種類查詢往往不具實用性。 評估網站是否全球性抑或是區域性 三、文獻回顧 網際網路的興起 網際空間(Cyberspace)的定義 資料挖掘(Data Mining) 網域名稱服務(Domain Name Service,DNS) 資料挖掘 資料挖掘又稱知識探勘(Knowledge Discovery)是一種『從大量資料中自動擷取重要的、潛在有用的資訊類型或知識』的過程。 藉由一個電腦程式,可以日以繼夜地在數量龐大的資料中找出有用的資料類型或知識模型。 資料挖掘的功能可包含下列五項功能: (1)?? 分類(classification) (2)?? 推理(estimation) (3)?? 預測(prediction) (4)?? 關連分組(affinity grouping) (5) 同質分組(clustering) 常用的Data Mining分析工具 Case-based Reasoning Data Visualization Fuzzy Query and Analysis Knowledge Discovery Neural Networks 網域名稱服務(Domain Name Service) Packets transferring over IP protocal Domain Name ??IP address 網域名稱依照使用單位的特性,大致分類為以下七大種頂級網域名稱(Top-Level Domains,TLDs): ? MIL :軍事單位 ? EDU :教育機構 ? GOV :政府機構 ? COM :商業機構 ? ORG :法人機構 ? NET :網路機構 ? COUNTRY-LEVEL:國家網域名稱 研究方法 一、挖掘地理參照資訊 1.利用網域名稱查詢 2.利用WHOIS資料庫 3.利用traceroute工具查詢 4.利用主機的網頁伺服器 5.查詢主機時間 6.網域名稱服務的延伸 7.網路服務提供者(ISPs)的命名原則 二、後端地理資訊分析 一、利用網域名稱查詢 以UNIX系統為例: [ccsun]/users/ nslookup Server: .tw Address: Name: .tw Address: 誤差可能原因 美國的單位並不用加上國家網域名稱 有許多例外情形下,國家網域名稱往往並不代表實體空間中所代表的位置。 Ex:Moldova(.md)?www.eyedoctor.md Tonga(.to)?welcome.to,go.to 不定期更新管理的DNServer 二、利用WHOIS資料庫 WHOIS資料庫是各單位在向主管機關註冊網域名稱時所填寫的基本資料,內容有管理者的聯絡方式(Email)、住址、網域名稱、IP位址、居住城市、居住國家、更新日期等。 誤差可能原因 通常在WHOIS資料庫註冊的單位是比較高層次的單位,而無法確切的知道每個單機(host)的資料。 資料庫定期維護更新的問題 三、利用traceroute工具查詢 traceroute工具可查詢資料封包從起始點到終點所行經的路徑以及速度。因此我們可以大致由封包行進的趨勢判斷資料封包的目的地落在何處

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档