百度分詞技術就是百度針對用戶提交查詢的關鍵詞串進行的查詢處理后根據(jù)用戶的關鍵詞串用各種匹配方法進行的一種技術。所謂分詞就是把字與字連在一起的漢語句子分成若干個相互獨立、完整、正確的單詞。詞是最小的、能獨立活動的、有意義的語言成分。計算機的所有語言知識都來自機器詞典(給出詞的各項信息)、句法規(guī)則(以詞類的各種組合方式來描述詞的聚合現(xiàn)象)以及有關詞和句子的語義、語境、語用知識庫。中文信息處理系統(tǒng)只要涉及句法、語義(如檢索、翻譯、文摘、校對等應用),就需要以詞為基本單位。當漢字由句轉化為詞之后,才能使得句法分析、語句理解、自動文摘、自動分類和機器翻譯等文本處理具有可行性??梢哉f,分詞是機器語言學的基礎。
看了上述百度的介紹大家對百度的分詞技術都了解了把!那么我們看看我們?nèi)绾瓮ㄟ^這種手段為我們seo網(wǎng)站優(yōu)化助力!
一:字符串匹配的分詞方法
(1)正向最大匹配法
就是把一個詞從左至右來分詞
舉個例子:”不知道你在說什么”
這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說什么”。
(2)反向最大匹配法
“不知道你在說什么”反向最大匹配法來分上面這段是如何分的?!安?,知道,你在,說,什么”,這個就分的比較多了,反向最大匹配法就是從右至左。
(3)就是最短路徑分詞法
就是說一段話里面要求切出的詞數(shù)是最少的。"
“不知道你在說什么”最短路徑分詞法就是指,把上面那句話分成的詞要是最少的?!安恢?,你在,說什么”,這就是最短路徑分詞法,分出來就只有3個詞了
(4)雙向最大匹配法。
而有一種特殊的情況,就是關健詞前后組合內(nèi)容被認為粘性相差不大,而搜索結果中也同時包含這兩組詞的話,百度會進行正反向同時進行分詞匹配。
二:詞義分詞法
就是一種機器語音判斷的分詞方法。很簡單,進行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象來分詞,這種分詞方法,現(xiàn)在還不成熟,處在測試階段
三:統(tǒng)計分詞法
根據(jù)詞組的統(tǒng)計,就會發(fā)現(xiàn)兩個相鄰的字出現(xiàn)的頻率最多,那么這個詞就很重要。就可以作為用戶提供字符串中的分隔符,這樣來分詞
比如,“我的,你的,許多的,這里,這一,那里”等等,這些詞出現(xiàn)的比較多,就從這些詞里面分開來。
如果一天寫10篇文章,一年就可以寫3650篇文章,給你的網(wǎng)站寫3650個關鍵詞并合理布局到你網(wǎng)站中,可以使用關鍵詞挖掘工具提詞,根據(jù)用戶需求進行關鍵詞的篩選,吸引流量指日可待。分詞還有一種好處,那就是提升內(nèi)頁的排名。SEO是心理學,去猜想用戶使用什么詞搜索,從而進行非常有意思的工作。
版權聲明: 本站資源均來自互聯(lián)網(wǎng)或會員發(fā)布,如果侵犯了您的權益請與我們聯(lián)系,我們將在24小時內(nèi)刪除!謝謝!