自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合###SXB###B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量###SXB###C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同###SXB###D.其它答案都不对

自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:

A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合###SXB###B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量###SXB###C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同###SXB###D.其它答案都不对
参考答案和解析
C解析:自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。故答案为C。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。

相关考题:

关于XML的描述,不正确的是( )。A、可扩展的标识语言B、自然语言C、元语言D、结构化描述语言E、文档自含结构

● 下面关于UML 文档的叙述中正确的是 (36) 。(36)A. UML 文档指导开发人员如何进行面向对象分析B. UML 文档描述了面向对象分析与设计的结果C. UML 文档给出了软件的开发过程和设计流程D. UML 文档指导开发人员如何进行面向对象设计

在Word2003中,关于打印预览描述正确的是()。A、打印预览是文档视图显示方式之一B、预览的效果和打印出的文档效果相匹配C、无法对打印预览的文档进行编辑D、在打印预览方式中可同时查看多页文档

Swing中的组件往往采用MVC结构,MVC指的是Model、View和【 】。

下面关于文档体的说法正确的一项是______。A.文档体以起始标记开始,文档体元素以结束标记 下面关于文档体的说法正确的一项是______。A.文档体以起始标记<TR>开始,文档体元素以结束标记</TR>结尾B.严格地讲,使用<BODY>起始和结束标记是必需的C.在文档中,必须以严格的ASCII格式输入文本D.ASCII字符无需通过特殊的编码系统就能加到文档中

关于Word中的多文档窗口操作,下列叙述中,不正确的是(48)。A.一个文档窗口可以拆分为两个文档窗口B.允许同时打开多个文档进行编辑,每个文档有一个文档窗口C.多个文档编辑工作结束后,关闭文档窗口只能逐个进行D.多文档窗口之间也可以进行剪切、粘贴和复制操作

DOM(Document Object Model)最适合应用在()。 A.内存受限时B.只有特定的元素需要处理C.文档很大D.文档必须非顺序地处理

下列关于word中的多文档窗口操作,表述不正确的是( )。A.通过多文档窗口操作,文档窗口可以拆分成为两个文档窗口B.多个文档编辑工作结束,只能全部存盘后才可关闭文档窗口C.允许同时打开多个文档进行编辑,每个文档有一个文档窗口D.多个文档窗口的内容之间可以进行剪切、粘贴和复制等操作

关于word的多文档窗口操作,下列叙述不正确的是(?)。A.文档窗口可以拆分为两个文档窗口B.分别显示文档的不同部分C.允许同时打开多个文档进行编辑,且每个文档有一个文档窗口D.多个文档窗口之间的内容,可以进行剪切、复制和粘贴等操作

关于XML接口DOM,下列描述错误的是()。A、DOM的全称是“Document Object Model”,即文档对象模型B、在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树)C、通过DOM接口,应用程序可以在任意时刻访问XML文档中的任何一部分数据,因此,这种利用DOM接口的机制也被称作随机访问机制D、DOM强制使用树模型访问XML文档中的信息,不适合XML的模式

使用ShAre Point TeAm Services站点中的文档库,可以直接在网页环境中创建Office XP文档,下面描述正确的是()A、在一个文档库中可以同时创建Word和Excel文档B、在一个文档库中可以同时创建Word、Excel、PowerPoint和FrontPAge文档C、在文档库中只可以创建Word文档D、以上描述均不正确

以下关于文档管理的描述中,()是正确的。A、程序源代码清单不属于文档B、文档按项目周期角度可以分为开发文档和管理文档两大类C、文档按重要性和质量要求可以分为重要文档和次要文档D、《软件文档管理指南》明确了软件项目文档的具体分类

DOM(Document Object Model)定义了文档的()和访问、操纵文档的方法。它为XML、HTML提供了应用程序接口API。

下列关于计算表示论述中,不正确的是()A、用自然语言表示算法通俗易懂,描述包含分支和循环的算法方便B、流程图是用一些图框表示各种操作,用图形表示算法,直观形象,易于理解C、伪代码是介于自然语言和计算机语言之间的文字和符号来描述算法D、用计算机语言表示算法必须严格所用语言的语法规则

大多数中文文本分类系统都采用词作为(),称作特征词。这些特征词作为文档的中间表示形式,用来实现文档与文档、文档与用户目标之间的相似度计算。A、自变量B、因变量C、特征项D、向量

关于Django的MVC模式描述正确的是()A、模型(Model),数据存取层:处理与数据相关的所有事务,即如何存取、如何验证有效性、包含哪些行为以及数据之间的关系等B、模板(Template),表现层:处理与表现相关的决定,即如何在页面或其他类型文档中进行显示。C、视图(View),业务逻辑层:存取模型及调取恰当模板的相关逻辑。模型与模板之间的桥梁。D、对比MVC模式,Django的URLconf属于controller部分

关于“开始”菜单中的“文档”的描述,正确的是()。A、该计算机上的所有文档都可以在这一菜单中找到B、文档菜单的项目可以清除C、文档的类型只能是文本,而不能是图形D、文档菜单能够存放文件的个数不受限制

状态空间表达式(state space model)

关于word的多文档窗口操作,下列叙述不正确的是()。A、文档窗口可以拆分为两个文档窗口B、分别显示文档的不同部分C、允许同时打开多个文档进行编辑,且每个文档有一个文档窗口D、多个文档窗口之间的内容,可以进行剪切、复制和粘贴等操作

关于MVC下面说法正确的是()A、MVC表示模型,视图,控制器B、在model 1体系结构中没有使用ServletC、model 1体系结构适合小型项目,开发效率较高,但大型项目会有维护问题D、JavaBean可以访问数据库

下面关于MVC的说法不正确的是()。A、M表示Model层,是存储数据的地方B、View表示视图层,负责向用户显示外观C、Controller是控制层,负责控制流程D、在MVC架构中jsp通常做控制层

以下关于DOM对象说法正确的是()。A、是文档对象模型B、是Document object model的缩写C、是浏览器对象模型D、是Bowers object model的缩写

下面关于Word的说法中,正确的是()。A、Word只能将文档保存成Word格式B、Word文档只能有文字,不能加入图形C、Word不能实现“所见即所得”的排版效果D、Word能打开多种格式的文档

DOM(Document Object Model)最适合应用在()。A、内存受限时B、只有特定的元素需要处理C、文档很大D、文档必须非顺序地处理

多选题以下关于DOM对象说法正确的是()。A是文档对象模型B是Document object model的缩写C是浏览器对象模型D是Bowers object model的缩写

单选题下面关于Word的说法中,正确的是()。AWord只能将文档保存成Word格式BWord文档只能有文字,不能加入图形CWord不能实现“所见即所得”的排版效果DWord能打开多种格式的文档

单选题DOM(Document Object Model)最适合应用在()。A内存受限时B只有特定的元素需要处理C文档很大D文档必须非顺序地处理

单选题使用ShAre Point TeAm Services站点中的文档库,可以直接在网页环境中创建Office XP文档,下面描述正确的是()A在一个文档库中可以同时创建Word和Excel文档B在一个文档库中可以同时创建Word、Excel、PowerPoint和FrontPAge文档C在文档库中只可以创建Word文档D以上描述均不正确