WEB使用者查询关键字分析研究.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
WEB使用者查詢關鍵字分析研究 指導教授:張志祥 老師 大綱 研究動機 研究目的 研究方法 研究方法 轉碼示意圖 使用工具 分類、關鍵字的說明 Google API說明 Google API 示意圖 Google API Google API Sample Data 字數分析 Query String 範例 詞彙分析 Query String 範例 搜尋分析 Query String範例 翻頁統計 個案 研究結果 Conclusion 根據所分析之結果,可知道常使用的搜尋方法,或者可提供給網管參考,禁止上色情網站或者其他線上遊戲網站. 亦可了解透過學校網站去搜尋自己想知道的事物,會利用哪些搜尋引擎,或是會主要使用那各搜尋引擎. 在研究的過程當中,抓到的資料有絕大部分是無法使用的。這是因為使用者在搜尋中輸入的關鍵字無法搜尋到需要的資料,此現象乃因大部分的人還不了解一些搜尋的技巧。 本研究可作為使用者查詢的精鍊(User Query Refinement) 之研究的前置的分析。 * * 組長:廷安 組員:家榮    文中    彥豪 1. 研究動機 6.分類、關鍵字說明 2. 研究目的 3.研究方法 4.轉碼示意圖 5.使用工具 7.Google API 說明 8.統計資料(INput) 9.研究結果 10.Conclusion 現今網際網路有如一超級資料庫,擁有包羅萬象 的資訊。使用者以關鍵字在搜尋引擎中進行搜尋資料, 其結果並非是理想的,可能造成的原因如: 1.關鍵字本身的語意造成差異。 2.使用者輸入不當或意義不完整的關鍵字。   則如果使用者在執行搜尋時,能根據特定的領域 知識進行搜尋,提供與搜尋目標有關的關鍵字,使輸 入的關鍵字資料更為完整和正確,以降低這方面的搜 尋誤差。 有鑑於網路使用行為的研究在國外已受到相當的 重視,本研究目的為藉由學校網路對外連結的檢索紀 錄挑出大量有用的檢索詞彙,發展一套系統來分析全 校師生使用搜尋引擎的習慣、興趣,並進一步了解全 校師生的資訊需求及提升對網路搜尋方法之參考。可 即時觀察到全校師生使用網路搜尋引擎的時間、興趣 的分佈與變化,所獲得的資訊對於了解師生資訊需求 ,改善網路搜尋系統檢索效益,並為未來的研究:使用者查詢的精鍊(User Query Refinement) ,作前置的分析。 1. 收集資料:從學校Proxy Server上,取出每天學生上網的URL Log檔。因為資料量與上網學生樣本數夠多,所以具有分析的價值。 2. 事前處理:因為URL Log檔為非WIN32平台,所以在句 子結尾部分與WIN32平台有所不同 。 為使程式可以分 句解析,所以 要進行事前的轉置工作,將其句子結尾 部分變成WIN32 平台所能辨識。故使用UltraEdit工具進 行轉置。 3.資料處理: 1.使用Mircosoft .NET Framework SDK1.1內附URLDecode函 式 來分解經過事前處裡的資料。所得到的資料為UTF- 8編碼的資料。 2.然後把UTF-8的字串變數轉成byte陣列,再去宣告使用 Big5 字碼Encoder , 把UTF-8 之byte陣列轉換成Big5之 byte陣列【雖然兩者都是以2位元為一個單位,但其編 碼值卻不一樣,所以結果也不相同。】 4.資料分析:使用Google所提供的API進行網頁分群分析。 1.UltraEdit(平台句子結尾轉置) 2.Mircosoft .NET Framework SDK1.1(URL解析) 3.Visual Basic6.0(編碼轉換、資料庫寫入) 4.Access2000(資料庫) 5.JDK1.4.2(資料分析呼叫Google API) 本研究把全校師生的搜尋分成16種主要項目,做 為分析探討全校師生使用搜尋引擎的依據。此16個項 目包刮: 健康、科學、購物、電腦、遊戲、運動、參考、 考試類、商業、休閒、手機、藝術與娛樂、社會、新 聞、圖書文件、情色。 API = Application Programming Interface 可翻譯為 : 編程介面,簡稱API(Application Programming Interface),就是軟體系統不同組成部分銜接的約定。 您可以把它想成一座橋樑,一座連接您的程式與服務提供者的橋樑。您可以使用API存取使用該服務。 Go

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档