1. 论坛系统升级为Xenforo,欢迎大家测试!
    排除公告

百度搜索引擎中文分词的三点原理

本帖由 萧萧服务2011-03-21 发布。版面名称:SEO 专区

  1. 萧萧服务

    萧萧服务 New Member

    注册:
    2011-03-21
    帖子:
    12
    赞:
    0
    百度中文分词算法:指搜索引擎为了更好的辨别用户的需求,并且为了快速提供给用户需求性信息而使用的算法。
      搜索引擎要在单位时间内处理千万亿级的页面数据量,因此搜索引擎拥有一个中文词库。比如百度现在大约有9万个中文词,那么搜索引擎就可以对千亿级的页面进行分析,按照中文词库进行了分类。

      百度分词基本有三种分法

      1、基于理解:傻瓜式匹配,小于等于3个中文字符百度是不进行切词的,比如搜索“大学堂”。
     
  2. 0309a

    0309a New Member

    注册:
    2011-03-09
    帖子:
    521
    赞:
    0
    学习一下,谢谢分享
     
  3. 3906933

    3906933 New Member

    注册:
    2011-03-14
    帖子:
    66
    赞:
    0
    这个很好啊!学习了!
     
  4. rqblmy

    rqblmy New Member

    注册:
    2010-10-02
    帖子:
    502
    赞:
    0
    进来看一下。
     
  5. q84816977

    q84816977 New Member

    注册:
    2011-03-10
    帖子:
    23
    赞:
    0
    这个很好阿。 支持
     
  6. 丫头

    丫头 New Member

    注册:
    2011-03-22
    帖子:
    40
    赞:
    0
    学习了....
     
  7. 173782322

    173782322 New Member

    注册:
    2010-09-04
    帖子:
    271
    赞:
    0
    学习一下,
     
  8. qdsjzh

    qdsjzh New Member

    注册:
    2011-03-22
    帖子:
    51
    赞:
    0
    学习了~感谢分享