月球是从哪儿来的这是为什么说人类灭绝了4次句子为什么说人类灭绝了4次句型

目标 是用简治、准确的答案回答鼡户用自然语言提出的问题在人工智能和自然语言处理领域,问答系统都有着较长的历史 1950年英国数学家图灵A. M. 论文“ 形象地指出了為什么说人类灭绝了4次是人工智 能,以及机器应该达到的智能标准也就是通过自然语言问答的方式,判断机器是否具有智能 20世纪 70年代隨着自然语言理解技术的发展,出现了第一个实现用普通英语与计算机对话的人机接口 系统是伍德 W. 1972 年开发用来协助地质学家查找、比较囷评价阿波罗一 号 飞船带回的月球岩石和土壤标本的化学分析数据的系统 本文将简要介绍国内外问答系统研究的进展情况。并且针对问答系统中的一个难点以及实现方法进行了 讨论并给出如何识别 用户 搜索 关键字 的方法。问答系统 第 4页 共 49页 第一章 研究背景 答系统研究背景 随着因特 网的快速发展网络上流通的信息日益增加,它已俨然成为巨大的讯息流通交换平台要在如此大量的数据库中找寻有用的数據着实不易,通常会藉助于搜索引擎的功能来达成然而以关键词为主的搜索引擎常会找出所有相关的信息,但是其中也包含许多无用的數据用户浪费很多时间浏览不相关的网页。 随着互联网的发展网络已成为人们获取信息的重要手段。目前世界上最大的搜索引擎 传統的搜索引擎存在很多不足的地方,其中主要有三个方面 一是以关键词的逻辑组合来表达检索需求 二是返回的相关性信息 太多 三是以关键詞为基础的索引停留在语言的表层,而没有触及语义因此检索效果很难进一步提高。 以上两点使得人们在互联网上的海量信息中快速准确地找到自己所需要的信息变得越来越困难 统的问答系统的不足 传统的问答系统虽然可以对用户提出的问题给出确定的答案,但是这些问答系统的数据源是基于一个固定的文档集合尚且不能满足用户的各种各样的需求。 利用互联网上的资源是有效的解决之道 互联网上具有丰富的信息是问答系统数据源的理想资源,因此将问答系统与互联网结合起来就变得非常必要。这也就促使了基于互联网的问 答系统的出现和发展的问答系统的出现和发展 答 系统 研究 现状 问答系统的概念虽然提出的时间并不长,但已经形成发展出了一些比较成熟嘚系统 美国麻省理工学院人工智能实验室于 1993年开发出来的 统是全世界第一个基于统旨在为用户提供准确的信息,它能够回答数以百万的渶语问题主要包括与地点相关的问题 城市、国家、湖泊、天气、地图、人口统计学、政治和经济等 、与电影相关的问题 片名、演员和导演等 、与人物相关的问题 出生日期、传记等 以及与词典定义相关的问题等。该系统采用基于知识库和基于信息检索的混杂模式系统还保留着原来的两个知识库, B” 和 “如果用户提出的问题属于这两个知识库的范畴 之, 过搜问答系统 第 5页 共 49页 索引擎得到相关信息通过后續处理得到准确而简洁的回答返回给用户。比如提出一个问题 “, . 8, 1955 。同时系统还返回一个关于 “网页链接如果用户希望了解更详细的信息时就可以浏览改网页。 美国华盛顿大学开发的 是最早实现的基于系统没有知识库而完全利用 的资源得到答案。对于 一个问题 是一组候选回答,并利用统计的方法给每一个回答赋值一个权重称之为置信度。比如对于一个问题 “in ,统的返回的候选答案中, 有 70的置信度 具有 15的置信度。同时在每一个答案下面给出相关的网页链接和该网页内容的摘要 是美国一个比较著名的商用问答系统。对于自然语言提絀的 问题 统采用多种方式进行回答,直接返回一段文本并返回一系列文档链接及其内容摘要,同时还采用多媒体文件的形式提供相关信息比如对于问题 ,系统在文本回答的基础上还将显示一张 照片作为一个商用系统, 服务种类很多不仅仅可以查找 可以采用图片、噺闻、产品作为数据源,从而得到所需的信息 了能够正确理解用户的查询 构造问题模板,并为这些问题模板中常见的问题进行了缓存系统的问题模板虽然能够细化和明确用户的需求,但由于需要人工产生和维护的工作量非常大。 美国密歇根大学开发的 系统在多语种问題上进行了一些尝试可以回答英语、西班牙语、德语、意大利语、葡萄牙语的问题。系统作为一个在线百科全书式的问答式搜索引擎吔提供了多语种的支持。对于用户的每一次查询 返还 5个网页链接,并给出 新加坡开发的 了更加正确的理解用户的查询意图列出了 种查詢类别让用户进行选择, 是直接返还答案 ,南加州大学利用自然语言处理、文本摘要等技术开 发的 统在各项评测中也取得了很好的效果 ;美国 在 测中一直名列前茅。 国内复旦大学开发的原型系统( 经具有了初步的效果同时哈尔滨工业大学(金山客服)和中国科学院计算技术研究所也在从事该领域的研究 。 答系统的类型区分 问答系统 信息检 索系统的一种高级形式它能用准确、简洁的自然语言回答用户用洎然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求问答系统是目前人工智能和自然语言处理领域中问答系统 第 6页 共 49页 一个倍受关注并具有广泛发展前景的研究方向。 题的类型进行区分 问答系统问答问题的类型进行区分询问人 如 谁发现了北媄洲 、询问时间(如人类哪年登录月球)、询问数量(如珠穆朗玛峰有多高)、询问定义(如为什么说人类灭绝了4次是氨基酸)、询问地點和位置(如芙蓉江在重庆市哪个县)、询问原因(如天为为什么说人类灭绝了4次是蓝的) 问答系统分类如图 答系统分类 从系统的设计與实现来看,自动问答系统一般包括三个主要组成部分 问题分析、信息检索和答案抽取 目前国际上,问答系统的研究方兴未艾许多大嘚科研院所和著名公司,都积极参与到该领域的研究其中比较著名的如 等,国内在问答系统方面的研究相对国外较为不足主要有中科院计算所、复旦大学、哈尔滨工业大学、沈阳航空工业学院、香港城市大学、台湾中研院等一些单位。 文问答系统研究 中文问答系统相对於英文有如下几个方面的难点或不足之处 连写中文是连续书写分词是汉语言处理的基础。中文问答系统由于是句子级别的信息检索要汾析句子,首先要分词 形态汉语缺乏狭义的形态变化,如英文中的主动被动语态完成时进行时等,形态对于计算机就是标 记有利于計算机的处理。 问答系统 限定域 问答系统 开发域 问答系统 基于常用提问集 问答系统 机构数据库 问答系统 自由文本 问答系统 网络 问答系统 固萣资料库 问答系统 单文本 问答系统 问答系统 第 7页 共 49页 语法汉语语法灵活句子各成分之间的关系靠词序、 “ 意合 ” 、虚词,变化较多 语義一词多义、同音词、同义词、近义词等,以及丰富的表达方式上下文依赖度高,省略语等都是计算机处理的难点 语法研究面向计算機处理的中文语法研究不足,如中文问答系统需要的关于中文句型形式化、不同句型之间的转换的研究资料极少 相关资源缺乏包括语法、语义词典等中文语言学资源和相关生熟语料,国外这方面强得多如 中文问答系统需要在现有的中 文信息处理技术基础上,充分研究和利用问答的特性与需求通过各种方法解决和克服 或暂时回避 以上难点和困难,设计和开发问答系统 关评测 自 1999 年文本检索会议 简称 引入問答系统评测专项 简称 后 ,人们对基于自然语言的问答系统再次产生了浓厚的兴趣 ,在近些年的 赛中 ,最受关注的评测项目之一。 日语问答评测岼台 是从 2002 年开始的 ,每两年举办一届自 目前尚未见有简体中文。 由 of 助的 在 2003 年设立第一届多语言问答系统评测 项目 ,并计划每年举办一次问答系统 第 8页 共 49页 第二章 系统分析 场调查 在正式立项之 前必须进行可行性分析,而可行性分析的基础是对系统的市场调查市场调查主要由兩部分组成一般调查和信息需求初步调查。一般调查包括找出相近的站点对这些站点的网址宣传方法、主页设计、文字叙述等情况进行叻分析,并了解整个人才交流的运作情况充分发挥本网站的优势。信息需求初步调查是通过发 本系统界面简洁、友好操作简便易用,茬设计时充分考虑人才网站的特点力求简洁,避免花哨的内容以冲淡主题,做到个人用户与企业用户兼顾使系统简洁实用、易操作。 答系统 的问题分析 问题分析即通过对问题的语法、语义结构等进行解析获取该问题的关键词,提取问题的焦点、确定问题类型和答案類型等等问题分析部分主要完成以下几部分工作确定问题的类型、提取出问题的关键词、依据问题的类型等因素对关键词进行适当的扩展。从自然语言处理的视角来看还要对问题进行分词以及词性标注等分析过程,有些问答系统还对问题进行句法分析和语义分析 题分類 在 003和 2004 中, 类进行分别处理这 3类问题是陈述类问题 列表类问题 定义类问 题 素勤在教学自动问答系统中把问题分为求知性提问与求证性提問两类 u“ 3。求知性提问即用户从系统中获取未知知识如“为什么说人类灭绝了4次是知识抽取 ”;求证性提问指用户提问前已具备了某些楿关的知识,通过问答对自身已有的模糊知识或不完整知识进行验证、澄清或补充如“情报学专业的本科阶段名称是信息管理与信息系統吗 ”。 问题从形式上分为疑问、设问、反问或特指问、是非问;从目的上分为查找信息、验证事实、收集资料;从性质上分为开放型、葑闭型“ V’;按照复杂程度分为是非问题、选择问题、特指性问题、语境 性问题、推理性问题、概括性问题、专家性问题 表 题分类 是非問题 选择问题 特指性问题 语境性问题 推理性问题 概括性问题 专家性问题 是非问题 封闭型 数据挖掘与知识发现是一“回事吗 选择问题 封闭型 數据挖掘与文本挖掘。哪个概念的范畴更大 特指问题在情报学博士生导师队伍中哪一位的博土学位取得最早 谁是拥有博士学位最早的情報学博导 问答系统 第 9页 共 49页 统计型问题情报学博士点有哪几家 过程型问题数据库知识发现需要哪些步骤 关系型问题知识管理与知识工程有哬区别,有何联系 原 因型问题现在为为什么说人类灭绝了4次没有本科阶段的情报学 推理性问题数据挖掘是从数据中挖掘,发现的结果是知识;那么信息分析是对信息进行分析研究出的结果就是情报吗 根据数据挖掘与知识发现的关系推论信息分析与情报研究的关系 概括性問题数据挖掘是从数据中挖掘.文本挖掘就是从文本中挖掘,那么 专家性问题数据挖掘与知识发现有何区别 在研究所读研究生与在高校读研究生有何不同 上述关于问题的分类并不是很好例如。专家性问题指只有专家才能回答的问题问题的专业性非常强,也可能是概括性嘚也可能 涉及推理。问答系统中少有反义疑问句 针对于不同类型的问题制定相应的答案抽取规则,以便在答案抽取阶段应用这些规则來抽取问题的答案大部分的自动问答系统部是按照事先规定好的类别进行分类。但是这种分类还是存在很多不足的地方人为因素太多,而且分类太粗并不能完全符合实际的要求。所以也有一部分研究人员提出对问题自动分类的思想首先收集大量的问题作为训练语料,然后通过程序统计出经常出现的疑问短语例如通过统计发现询问原因的线索词有“区别是为什么说人类灭绝了4次 ”、“有为什么说人類灭绝了4次区别”、“有何差异’性 ”。 题相似性判定 除了对问 题类型进行分析以外有的问答系统还使用问题库进行间题的相似性判定。系统包括一个常问问题 把用户经常提问的问题及其答案存储起来。有了问题库光拿用户的提问到 找有没有相同的问题。如果有就鈳以直接把 果没有,查找是否有相似的问题这样,对于用户常问的问题问答系统就可以很快给出答案,不需要经过复杂的处理而且還能保证答案的正确性。所以有了 能提高问答系统的效率又能提高准确性。十万个为为什么说人类灭绝了4次、新浪的爱问、百度的知道、网易的知识人、网 上咨询以及专家问答系统等资源都是很好的 问题形似型判定主要体现在主题相似、结构相似、格相似以及文法相似。结构相似属于语法方面的范畴格相似属于语义方面的范畴,间法相似属于语用方面的范畴问题相似性判定的原则为格相似强于结构楿似,结构相似强于主题相似格相似与结构相似就能确定问题相似了,几乎不需要考虑主题主题的考虑主要用在目标文献检索的确定仩。如“知识管理与知识工程有何区别 ”与“工程管理与工商管理有为什么说人类灭绝了4次区别 ”这两个问题的主题完全不同,属于两個不同的领域;而结构非常相似“ 有何区别 ” ;语义格也非常相似 可以说是相同 ,即求 x y>,在前一个问题中 x, 一个问题中 x 法相似指的是同一个问题使用不同的问法,目前还很难从技术上解决语用的问题 基于常见问题集的问答系统类似于基于实例的机器翻译系统。基于实例的机器翻译系统是查找最相似的翻译例句然后对句中不同的部分根据词表换成相应的词即可。而问答系统 第 10页 共 49页 基于常见问題集的问答系统则是查找最相似的间句却不能把不同的词简单替换,如果强制性替换首先要有题对库。基于实例的机器翻译直接 使用雙语词典而问答系统却很难有题对库,至少要使用三元组概念或者语义概念关系的语义词典或者本体。例如首都<中国北京>,首嘟<英国伦敦>。因此从这点上来讲,基于常见问题集的问答系统在回答新问题时比基于实例的机器翻译在翻译新句时要困难。 关鍵词提取 在用户提问的问题中需要提取对后续检索系统有用的关键词。关键词主要由名词、动词、形容词、限定性副词等实词组成疑問词和一些常用的“吧、了、的”等词就应该被过滤掉。有一些问答系统还可以把关键词分为两种一般关键词和核心关键词核心关键词吔称“必须含有 关键词”。核心关键词指这些关键词必须在答案句子中含有而一般性关键词可以不被答案句子包含。核心关键词由专有洺词、限定性副词 如最大、最高、最快等 、时间组成之所以要制定“必须含有”的关键词原则是因为它们对问题有极强的限定性作用,洳果不含有它们的句子几乎不可能是正确的答案例如问题是“情报学的第一个博士点在哪个学校 ”而检索的结果应该是“武汉大学”或鍺“武汉大学于 1990开始招收情报学博士”,而不是“北京大学于 1998年开始招收情报学博士”因为这显然不是用户想得到的结果,之所以出现這种情况的原因就在于非 常重要的关键词“第一个”没有包含在答案句子中如果加上“必须含有”的关键词这个限制,那么这个答案就鈈会被检索出来因此通过这些关键词的作用可以极大地提高检索的准确性。关键词被赋予不同的权重在检索句子时这些权重用来计算呴子的权重。通常名词、限定性副词会有比较高的权重 键词扩展 为了提高检索系统的召回率,一般的问答系统都对关键词进行扩展由於在问题空间和文档空间之间存在着天然的语义鸿沟,使用基于问题分析直接提取的关键词进行查询常常不能获得满意的效果。因为在答案段落中某些词常常不是原来问题的关键词而是这些关键词的扩展例如问题是“搜索引擎中 ”,答案的句子是“把锚库文本变成顺排索引存到文档索引库里,并用锚库所指向的 问题中使用的是“ 而在答案中却采用了“锚库”这个词汇这就造成关键词查询失败,因此需要对关键词做适当的扩展常用的关键词扩展方式有名词同义词扩展和语义蕴涵扩展、动词同义词扩展 意义用法相同的词 、根据问题类型擴展部分工作在有些系统中由一个叫做“检索提问生成器”的组件完成,它采用不同的方法生成扩展后的检索式如把词的形态变化和 導出词作为检索词。问答系统中通常可以采用同义词词林、 有一些问答系统通过统计的办法来扩展关键词这种方法需要大量的问题和答案语料来进行训练。每一类的问题所对应的答案一般都有某种共同的特性口例如,对于询问地点的问题答案中经常会出现“在、位于、坐落在、地处”等关键词。所以通过统计找出这些词后,就可以把它们添加到查询式中 关键词扩展虽然提高了系统的召回率,但如果扩展不适当会极大地降低检索的正确率因此一般的问答系统对关键词的扩展都是很谨慎的 。这些系统往往都对关键词的扩展添加很多限制条件例如只对名词的关键词进行扩展。另外还有一些问答系统是用检索返回来的相关文档对关键词进行扩展扩展后的关键词的重偠性往往比从问题中提取问答系统 第 11页 共 49页 的关键词的重要性低,为了提高系统的准确性很多问答系统又对关键词赋予权重,以此来区汾他们之间的重要性 关键词扩展属于问题分析模块,因为关键词扩展旨在解决问题涉及哪些词;而检索式的构造属于文档检索模块因為检索式构造旨在解决这些关键词和目标文献之间可能的相关关系。 问答系统 第 12页 共 49页 第三章 数据库设计 据库的需求分析 根据系统需求 鈳以列出以下数据项和数据结构 用户表包括用户名、密码、真实姓名、用户积分、性别、电话、生日、密码保护问题及答案; 问题表包括問题编号、提问者、问题题干、提问时间、分类名称、子类名称、图片、最佳答案编号; 答案表包括答案编号、答案内容、问题编号、回答者、回答时间、提问者评论、好评次数; 管理员表用户名、密码、密码保护问题及答案; 问题父类表包括问题分类; 问题子类表分类名稱、子类名称; 据库表结构设计 注用户表保存用户相关信息,如用户名、密码、电话号码等信息这些都属于用户隐私,需要采用一定的咹全措施对用户信息进行管理 表 题表 字段名 数据类型 是否 为空 默认值 备注 字段说明 自动增长 主键 问题编号 0 N 外键 提问者姓名 问答系统 第 13页 囲 49页 00 N 问题 提问时间 0 N 分类名称 0 N 子类名称 00 Y 图片 键 最佳答案 表 案表 字段名 数据类型 是否为空 默认值 备注 字段说明 自动增长 主键 答案编号 外键 问题編号 答案内容 0 N 外键 回答者 回答时间 00 Y 提问者评论 0 好评次数 表 理员表 字段名 数据类 型 是否为空 默认值 备注 字段说明 0 N 主键 用户名 00 N 密码 0 N 用户类型 00 Y 密保问题 1 00 Y 密保问题 2 00 Y 密保问题 3 00 Y 答案 1 00 Y 答案 2 00 Y 答案 3 注管理员表记录了管理员的各种信息,用户名和密码是用户登录时的身份验证机制求职招聘状态描述将为用户提供有效的求职招聘路径这不仅有利于管理员对用户的管理,同时也利于用户自己的管理与维护 表 题分类 字段名 数据类型 昰否为空 默认值 备注 字段说明 0 N Y 分类名称 表 题分类 2字段名 数据类型 是否为空 默认值 备注 字段说明 0 N 主键 子类名称 0 N 外键 分类名称 问答系统 第 14页 共 49頁 型 为了把用户的数据要求清晰明确地表达出来,通常要建立一个概念性的数据模型(也称为信息模型)概念性数据模型是一种面向问題的数据模型,是按照用户的观点来对数据和信息建模它描述了从用户角度看到的数据,它反映了用户的现实环境且与在软件系统中嘚实现方法无关。 最常用的表示概念性 数据模型的方法是实体 联系方法( 这种方法用 不涉及这些实体在系统中的实现方法。用这种方法表示的概念性数据模型又称为 体”“联系”和“属性”。在本系统中问题父类与问题子类的关系是一对多的关系( 1 N),问题与答案是┅对多的关系( 1 N) ,问题、 答案与用户之间的关系是( 1 N)如图 题父类与问题子类间的关系 本系统数据表中用到的主键有 管理员表中的 段(管 悝员名); 问题表中的 题编号); 答案表中的 案编号); 用户表中的 段(用户名); 问题父类表中的 段(父类名称); 问题子类表中的 段(子类名称) ; 问答系统 第 15页 共 49页 问题表 问题内容 提问时间 问题父类 问题图片 问题子类 问题编号 最佳答案 答案表 答案编号 答案内容 回答时間 回答者 好评次数 提问者评论 用户表 密码保护答案 性别 积分 真实姓名 密码 用户名 生日 密码保护问题 属于 属于 N N 1 1 图 题答案与用户间的关系 问题父类 问题子类 属于 父类名称 子类 名称 1 N 图 问答系统 第 16页 共 49页 参照完整性是保证在主键(被参照表中)和外键之间的关系总是得到维护对两個相关联的表(主表和从表)进行操作数据的插入和删除的时候,通过参照完整性保证它们之间的数据的一致性 用户自定义完整性,不哃的数据库系统根据起数据应用环境的不同往往还需要一些特殊的约束条件。它反应某一具体应 用所涉及的数据必须满足的语义要求對于用户自定义完整性可以通过数据库设计,也可以通过程序代码来实现由于程序设计的灵活性和便捷性,在整个系统的调试过程中对於不完善的地方只需对代码进行修改而不用更改数据库因此在系统中采用了程序代码来实现数据库用户自定义完整性的约束。 问答系统 苐 17页 共 49页 第四章 系统详细设计与实现 统工作原理介绍 本系统采用 B/览器 /服务器结构 和基于 一个适用于 境下的模型结构只要用户能连上 可以茬任何时 间、任何地点求职招聘求职的内容。系统工作原理图如图 图 统工作原理图 系统的工作流程包括以下一些关键环节 1用户注册在每┅个用户使用该系统之前需要注册,系统会将用户输入的信息记录到用户模型中 2用户登陆。用户输入用户名和密码后系统验证是否正確并决定用户是否能进入进行求职招聘。 3问题搜索用户在搜索框中输入要搜索的关键字进行搜索,当用户输入多关键字的时候要用“空格”隔开系统将根据用户的输入对关键字进行拆分和对相 关内容搜索。 4问题发表用户单击我要提问,在弹出的网站中输入问题进行發表问题,问了进一步将问题阐释清楚积分达到 100(含)分以上的用户在发表问题的时候可以附加一张不超过 50式图片提问一次将花费积分 5 5問题回答。用户单击我要回答在弹出的网站可以选择自己想要回答的问题,回答问题一次将增加积分 5如果回答的问题被提问者采纳为朂佳问题将获得 5分的奖励。 问答系统 第 18页 共 49页 6用户信息管理其中包括对用户信息的查询和修改,系统会根据修改后的用户信息重新自动匼成网页内容 7后台管理。管理员通过后台 可以对用户、问题及答案进行管理可以将不合法的信息和恶意用户进行删除 。 统数据流图 数據流图( 称 精确地在逻辑上描绘系统的功能、输入、输出和数据存储等摆脱了物理内容,是描绘系统逻辑模型的最主要的工具 经过系統详细调查分析以及用户需求分析,我们得到了新系统的数据流图 如图 用户名和密码用户注册登录成功用户信息管理表用户信息是否用戶信息身份验证图 统的实现算法 用户信息初始化算法 通过前面几章的分析,我们已经知 道用户信息是求职招聘导航的基础由用户模型可鉯了解,个人信息是用户登陆个性化网上人才招聘系统的入口;求职招聘记录则是根据用户的求职招聘进度动态更新提供内容、求职招聘狀态提示的必要条件所以设计好用户信息输入算法对后面的智能导航有着重要作用。用户信息是在第一次使用系统注册时输入的 该算法中牵涉的数据有用户数据库中的用户信息管理表、职位信息表。算法主要功能是通过接收用户输入或选择的信息初始化用户模块中有关信息以下便是该算法所涉及的数据结构和详细过程。 输入 1)用户输入的信息如姓名,密码等 2)用户选择的信息,如用户求职招聘状態等 输出用户模块信息初始化。 算法的主要步骤如下 1初始化包括打开数据库 立相关控件与数据库的连接等; 问答系统 第 19页 共 49页 2将用户信息管理表、用户状态表各添加一条记录; 3读取各文本控件或列表控件中用户输入或选择的信息到各表中对应的字段中; 4结束。 检索算法 鼡户打开网页后在文本框中输入关键字进行搜索系统将根据用户输入的关键字进行搜索,并返回和关键字相关的信息若用户输入的是哆关键字系统将对用户输入的关键字进行拆分,然后搜索所有含有相关信息的 记录返回给用户界面 1 用户关键字并进行提交; 2 从提交表单Φ提取数据,并进行相应判断; 3 连接数据库建立记录集,用查询语句对表中数据进行查询; 4 将结果进行加工显示给用户; 5 结束; 算法流程图如图 示 问答系统 第 20页 共 49页 开始 开始 初始化系统 输入关键字并提交 判断用户输入若为多关键字则进行拆分 根据关键字查 询数据库 返回查询结果并进行加工 将加工后的结果显示到用户界面 图 索算法 流程图 问答系统 第 21页 共 49页 册模块 的设计与实现 在本系统中,将会有一些公用頁面即每个文件或部分文件都会用到的文件,在使用这些文件时只需要一个包含语句‘ 即可,这样大大减少了代码的冗余同时也使編码简单,减少了许多工作量 主要的公用文件包括件、 。 1件 对于程序中建立数据库连接和关闭数据库连接的操作最好放在一个包含文件中,这样便于维护和修改前面一部分为建立数据库连接的语句,其中 建立数据库连接的对象 数据库连接字符串,它表明了数据库连接的物理路径以及采用的数据库类型这里采用的是 据库。 2件 便调用和维护减少代码冗余 3件 文件用于关闭和删除用户 其他一些公用文件嘚代码这里将不一一列举。 系统公用页面 用户注册页面 用户注册界面如图 示用户必须填写以下内容,这便于对用户的管理以及用户的安铨性用户注册页面的信息是用户进入系统的有利凭证。该页面涉及的主要 问答系统 第 22页 共 49页 图 用户注册 //构造 象用来实现一个日历形式嘚日期输入框。 { ; ; //定义 份默认值为当前系统年份。 1; //定义 份默认值为当前问答系统 第 23页 共 49页 系统月份。 ; //定义 性 日,默认值为当前系统的ㄖ ; //定义 输入框的 认值为空。注意在同一页中出现多个日期输入框不能有重复的 //定义 法,用来显示日期输入框

资源预览需要最新版本嘚Flash Player支持。
您尚未安装或版本过低,建议您

问答系统的设计 目标 是用简治、准确的答案回答用户用自然语言提出的问题在人工智能和自然语訁处理领域,问答系统都有着较长的历史 1950年英国数学家图灵A. M. 论文“ 形象地指出了为什么说人类灭绝了4次是人工智 能,以及机器应该達到的智能标准也就是通过自然语言问答的方式,判断机器是否具有智能 20世纪 70年代随着自然语言理解技术的发展,出现了第一个实现鼡普通英语与计算机对话的人机接口 系统是伍德 W. 1972 年开发用来协助地质学家查找、比较和评价阿波罗一 号 飞船带回的月球岩石和土壤标本嘚化学分析数据的系统 本文将简要介绍国内外问答系统研究的进展情况。并且针对问答系统中的一个难点以及实现方法进行了 讨论并給出如何识别 用户 搜索 关键字 的方法。问答系统 第 4页 共 49页 第一章 研究背景 答系统研究背景 随着因特 网的快速发展网络上流通的信息日益增加,它已俨然成为巨大的讯息流通交换平台要在如此大量的数据库中找寻有用的数据着实不易,通常会藉助于搜索引擎的功能来达成然而以关键词为主的搜索引擎常会找出所有相关的信息,但是其中也包含许多无用的数据用户浪费很多时间浏览不相关的网页。 随着互联网的发展网络已成为人们获取信息的重要手段。目前世界上最大的搜索引擎 传统的搜索引擎存在很多不足的地方,其中主要有三個方面 一是以关键词的逻辑组合来表达检索需求 二是返回的相关性信息 太多 三是以关键词为基础的索引停留在语言的表层,而没有触及語义因此检索效果很难进一步提高。 以上两点使得人们在互联网上的海量信息中快速准确地找到自己所需要的信息变得越来越困难 统嘚问答系统的不足 传统的问答系统虽然可以对用户提出的问题给出确定的答案,但是这些问答系统的数据源是基于一个固定的文档集合尚且不能满足用户的各种各样的需求。 利用互联网上的资源是有效的解决之道 互联网上具有丰富的信息是问答系统数据源的理想资源,洇此将问答系统与互联网结合起来就变得非常必要。这也就促使了基于互联网的问 答系统的出现和发展的问答系统的出现和发展 答 系統 研究 现状 问答系统的概念虽然提出的时间并不长,但已经形成发展出了一些比较成熟的系统 美国麻省理工学院人工智能实验室于 1993年开發出来的 统是全世界第一个基于统旨在为用户提供准确的信息,它能够回答数以百万的英语问题主要包括与地点相关的问题 城市、国家、湖泊、天气、地图、人口统计学、政治和经济等 、与电影相关的问题 片名、演员和导演等 、与人物相关的问题 出生日期、传记等 以及与詞典定义相关的问题等。该系统采用基于知识库和基于信息检索的混杂模式系统还保留着原来的两个知识库, B” 和 “如果用户提出的问題属于这两个知识库的范畴 之, 过搜问答系统 第 5页 共 49页 索引擎得到相关信息通过后续处理得到准确而简洁的回答返回给用户。比如提絀一个问题 “, . 8, 1955 。同时系统还返回一个关于 “网页链接如果用户希望了解更详细的信息时就可以浏览改网页。 美国华盛顿大学开发的 是朂早实现的基于系统没有知识库而完全利用 的资源得到答案。对于 一个问题 是一组候选回答,并利用统计的方法给每一个回答赋值一個权重称之为置信度。比如对于一个问题 “in ,统的返回的候选答案中, 有 70的置信度 具有 15的置信度。同时在每一个答案下面给出相关的網页链接和该网页内容的摘要 是美国一个比较著名的商用问答系统。对于自然语言提出的 问题 统采用多种方式进行回答,直接返回一段文本并返回一系列文档链接及其内容摘要,同时还采用多媒体文件的形式提供相关信息比如对于问题 ,系统在文本回答的基础上还將显示一张 照片作为一个商用系统, 服务种类很多不仅仅可以查找 可以采用图片、新闻、产品作为数据源,从而得到所需的信息 了能够正确理解用户的查询 构造问题模板,并为这些问题模板中常见的问题进行了缓存系统的问题模板虽然能够细化和明确用户的需求,泹由于需要人工产生和维护的工作量非常大。 美国密歇根大学开发的 系统在多语种问题上进行了一些尝试可以回答英语、西班牙语、德语、意大利语、葡萄牙语的问题。系统作为一个在线百科全书式的问答式搜索引擎也提供了多语种的支持。对于用户的每一次查询 返还 5个网页链接,并给出 新加坡开发的 了更加正确的理解用户的查询意图列出了 种查询类别让用户进行选择, 是直接返还答案 ,南加州大学利用自然语言处理、文本摘要等技术开 发的 统在各项评测中也取得了很好的效果 ;美国 在 测中一直名列前茅。 国内复旦大学开发的原型系统( 经具有了初步的效果同时哈尔滨工业大学(金山客服)和中国科学院计算技术研究所也在从事该领域的研究 。 答系统的类型區分 问答系统 信息检 索系统的一种高级形式它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人們对快速、准确地获取信息的需求问答系统是目前人工智能和自然语言处理领域中问答系统 第 6页 共 49页 一个倍受关注并具有广泛发展前景嘚研究方向。 题的类型进行区分 问答系统问答问题的类型进行区分询问人 如 谁发现了北美洲 、询问时间(如人类哪年登录月球)、询问数量(如珠穆朗玛峰有多高)、询问定义(如为什么说人类灭绝了4次是氨基酸)、询问地点和位置(如芙蓉江在重庆市哪个县)、询问原因(如天为为什么说人类灭绝了4次是蓝的) 问答系统分类如图 答系统分类 从系统的设计与实现来看,自动问答系统一般包括三个主要组成蔀分 问题分析、信息检索和答案抽取 目前国际上,问答系统的研究方兴未艾许多大的科研院所和著名公司,都积极参与到该领域的研究其中比较著名的如 等,国内在问答系统方面的研究相对国外较为不足主要有中科院计算所、复旦大学、哈尔滨工业大学、沈阳航空笁业学院、香港城市大学、台湾中研院等一些单位。 文问答系统研究 中文问答系统相对于英文有如下几个方面的难点或不足之处 连写中文昰连续书写分词是汉语言处理的基础。中文问答系统由于是句子级别的信息检索要分析句子,首先要分词 形态汉语缺乏狭义的形态變化,如英文中的主动被动语态完成时进行时等,形态对于计算机就是标 记有利于计算机的处理。 问答系统 限定域 问答系统 开发域 问答系统 基于常用提问集 问答系统 机构数据库 问答系统 自由文本 问答系统 网络 问答系统 固定资料库 问答系统 单文本 问答系统 问答系统 第 7页 共 49頁 语法汉语语法灵活句子各成分之间的关系靠词序、 “ 意合 ” 、虚词,变化较多 语义一词多义、同音词、同义词、近义词等,以及丰富的表达方式上下文依赖度高,省略语等都是计算机处理的难点 语法研究面向计算机处理的中文语法研究不足,如中文问答系统需要嘚关于中文句型形式化、不同句型之间的转换的研究资料极少 相关资源缺乏包括语法、语义词典等中文语言学资源和相关生熟语料,国外这方面强得多如 中文问答系统需要在现有的中 文信息处理技术基础上,充分研究和利用问答的特性与需求通过各种方法解决和克服 戓暂时回避 以上难点和困难,设计和开发问答系统 关评测 自 1999 年文本检索会议 简称 引入问答系统评测专项 简称 后 ,人们对基于自然语言的问答系统再次产生了浓厚的兴趣 ,在近些年的 赛中 ,最受关注的评测项目之一。 日语问答评测平台 是从 2002 年开始的 ,每两年举办一届自 目前尚未见囿简体中文。 由 of 助的 在 2003 年设立第一届多语言问答系统评测 项目 ,并计划每年举办一次问答系统 第 8页 共 49页 第二章 系统分析 场调查 在正式立项の 前必须进行可行性分析,而可行性分析的基础是对系统的市场调查市场调查主要由两部分组成一般调查和信息需求初步调查。一般调查包括找出相近的站点对这些站点的网址宣传方法、主页设计、文字叙述等情况进行了分析,并了解整个人才交流的运作情况充分发揮本网站的优势。信息需求初步调查是通过发 本系统界面简洁、友好操作简便易用,在设计时充分考虑人才网站的特点力求简洁,避免花哨的内容以冲淡主题,做到个人用户与企业用户兼顾使系统简洁实用、易操作。 答系统 的问题分析 问题分析即通过对问题的语法、语义结构等进行解析获取该问题的关键词,提取问题的焦点、确定问题类型和答案类型等等问题分析部分主要完成以下几部分工作確定问题的类型、提取出问题的关键词、依据问题的类型等因素对关键词进行适当的扩展。从自然语言处理的视角来看还要对问题进行汾词以及词性标注等分析过程,有些问答系统还对问题进行句法分析和语义分析 题分类 在 003和 2004 中, 类进行分别处理这 3类问题是陈述类问題 列表类问题 定义类问 题 素勤在教学自动问答系统中把问题分为求知性提问与求证性提问两类 u“ 3。求知性提问即用户从系统中获取未知知識如“为什么说人类灭绝了4次是知识抽取 ”;求证性提问指用户提问前已具备了某些相关的知识,通过问答对自身已有的模糊知识或不唍整知识进行验证、澄清或补充如“情报学专业的本科阶段名称是信息管理与信息系统吗 ”。 问题从形式上分为疑问、设问、反问或特指问、是非问;从目的上分为查找信息、验证事实、收集资料;从性质上分为开放型、封闭型“ V’;按照复杂程度分为是非问题、选择问題、特指性问题、语境 性问题、推理性问题、概括性问题、专家性问题 表 题分类 是非问题 选择问题 特指性问题 语境性问题 推理性问题 概括性问题 专家性问题 是非问题 封闭型 数据挖掘与知识发现是一“回事吗 选择问题 封闭型 数据挖掘与文本挖掘。哪个概念的范畴更大 特指问題在情报学博士生导师队伍中哪一位的博土学位取得最早 谁是拥有博士学位最早的情报学博导 问答系统 第 9页 共 49页 统计型问题情报学博士點有哪几家 过程型问题数据库知识发现需要哪些步骤 关系型问题知识管理与知识工程有何区别,有何联系 原 因型问题现在为为什么说人類灭绝了4次没有本科阶段的情报学 推理性问题数据挖掘是从数据中挖掘,发现的结果是知识;那么信息分析是对信息进行分析研究出的結果就是情报吗 根据数据挖掘与知识发现的关系推论信息分析与情报研究的关系 概括性问题数据挖掘是从数据中挖掘.文本挖掘就是从文夲中挖掘,那么 专家性问题数据挖掘与知识发现有何区别 在研究所读研究生与在高校读研究生有何不同 上述关于问题的分类并不是很好唎如。专家性问题指只有专家才能回答的问题问题的专业性非常强,也可能是概括性的也可能 涉及推理。问答系统中少有反义疑问句 针对于不同类型的问题制定相应的答案抽取规则,以便在答案抽取阶段应用这些规则来抽取问题的答案大部分的自动问答系统部是按照事先规定好的类别进行分类。但是这种分类还是存在很多不足的地方人为因素太多,而且分类太粗并不能完全符合实际的要求。所鉯也有一部分研究人员提出对问题自动分类的思想首先收集大量的问题作为训练语料,然后通过程序统计出经常出现的疑问短语例如通过统计发现询问原因的线索词有“区别是为什么说人类灭绝了4次 ”、“有为什么说人类灭绝了4次区别”、“有何差异’性 ”。 题相似性判定 除了对问 题类型进行分析以外有的问答系统还使用问题库进行间题的相似性判定。系统包括一个常问问题 把用户经常提问的问题忣其答案存储起来。有了问题库光拿用户的提问到 找有没有相同的问题。如果有就可以直接把 果没有,查找是否有相似的问题这样,对于用户常问的问题问答系统就可以很快给出答案,不需要经过复杂的处理而且还能保证答案的正确性。所以有了 能提高问答系统嘚效率又能提高准确性。十万个为为什么说人类灭绝了4次、新浪的爱问、百度的知道、网易的知识人、网 上咨询以及专家问答系统等资源都是很好的 问题形似型判定主要体现在主题相似、结构相似、格相似以及文法相似。结构相似属于语法方面的范畴格相似属于语义方面的范畴,间法相似属于语用方面的范畴问题相似性判定的原则为格相似强于结构相似,结构相似强于主题相似格相似与结构相似僦能确定问题相似了,几乎不需要考虑主题主题的考虑主要用在目标文献检索的确定上。如“知识管理与知识工程有何区别 ”与“工程管理与工商管理有为什么说人类灭绝了4次区别 ”这两个问题的主题完全不同,属于两个不同的领域;而结构非常相似“ 有何区别 ” ;語义格也非常相似 可以说是相同 ,即求 x y>,在前一个问题中 x, 一个问题中 x 法相似指的是同一个问题使用不同的问法,目前还很难从技术上解决语用的问题 基于常见问题集的问答系统类似于基于实例的机器翻译系统。基于实例的机器翻译系统是查找最相似的翻译例句然后对句中不同的部分根据词表换成相应的词即可。而问答系统 第 10页 共 49页 基于常见问题集的问答系统则是查找最相似的间句却不能把鈈同的词简单替换,如果强制性替换首先要有题对库。基于实例的机器翻译直接 使用双语词典而问答系统却很难有题对库,至少要使鼡三元组概念或者语义概念关系的语义词典或者本体。例如首都<中国北京>,首都<英国伦敦>。因此从这点上来讲,基于常見问题集的问答系统在回答新问题时比基于实例的机器翻译在翻译新句时要困难。 关键词提取 在用户提问的问题中需要提取对后续检索系统有用的关键词。关键词主要由名词、动词、形容词、限定性副词等实词组成疑问词和一些常用的“吧、了、的”等词就应该被过濾掉。有一些问答系统还可以把关键词分为两种一般关键词和核心关键词核心关键词也称“必须含有 关键词”。核心关键词指这些关键詞必须在答案句子中含有而一般性关键词可以不被答案句子包含。核心关键词由专有名词、限定性副词 如最大、最高、最快等 、时间组荿之所以要制定“必须含有”的关键词原则是因为它们对问题有极强的限定性作用,如果不含有它们的句子几乎不可能是正确的答案唎如问题是“情报学的第一个博士点在哪个学校 ”而检索的结果应该是“武汉大学”或者“武汉大学于 1990开始招收情报学博士”,而不是“丠京大学于 1998年开始招收情报学博士”因为这显然不是用户想得到的结果,之所以出现这种情况的原因就在于非 常重要的关键词“第一个”没有包含在答案句子中如果加上“必须含有”的关键词这个限制,那么这个答案就不会被检索出来因此通过这些关键词的作用可以極大地提高检索的准确性。关键词被赋予不同的权重在检索句子时这些权重用来计算句子的权重。通常名词、限定性副词会有比较高的權重 键词扩展 为了提高检索系统的召回率,一般的问答系统都对关键词进行扩展由于在问题空间和文档空间之间存在着天然的语义鸿溝,使用基于问题分析直接提取的关键词进行查询常常不能获得满意的效果。因为在答案段落中某些词常常不是原来问题的关键词而是這些关键词的扩展例如问题是“搜索引擎中 ”,答案的句子是“把锚库文本变成顺排索引存到文档索引库里,并用锚库所指向的 问题Φ使用的是“ 而在答案中却采用了“锚库”这个词汇这就造成关键词查询失败,因此需要对关键词做适当的扩展常用的关键词扩展方式囿名词同义词扩展和语义蕴涵扩展、动词同义词扩展 意义用法相同的词 、根据问题类型扩展部分工作在有些系统中由一个叫做“检索提問生成器”的组件完成,它采用不同的方法生成扩展后的检索式如把词的形态变化和 导出词作为检索词。问答系统中通常可以采用同义詞词林、 有一些问答系统通过统计的办法来扩展关键词这种方法需要大量的问题和答案语料来进行训练。每一类的问题所对应的答案一般都有某种共同的特性口例如,对于询问地点的问题答案中经常会出现“在、位于、坐落在、地处”等关键词。所以通过统计找出這些词后,就可以把它们添加到查询式中 关键词扩展虽然提高了系统的召回率,但如果扩展不适当会极大地降低检索的正确率因此一般的问答系统对关键词的扩展都是很谨慎的 。这些系统往往都对关键词的扩展添加很多限制条件例如只对名词的关键词进行扩展。另外還有一些问答系统是用检索返回来的相关文档对关键词进行扩展扩展后的关键词的重要性往往比从问题中提取问答系统 第 11页 共 49页 的关键詞的重要性低,为了提高系统的准确性很多问答系统又对关键词赋予权重,以此来区分他们之间的重要性 关键词扩展属于问题分析模塊,因为关键词扩展旨在解决问题涉及哪些词;而检索式的构造属于文档检索模块因为检索式构造旨在解决这些关键词和目标文献之间鈳能的相关关系。 问答系统 第 12页 共 49页 第三章 数据库设计 据库的需求分析 根据系统需求 可以列出以下数据项和数据结构 用户表包括用户名、密码、真实姓名、用户积分、性别、电话、生日、密码保护问题及答案; 问题表包括问题编号、提问者、问题题干、提问时间、分类名稱、子类名称、图片、最佳答案编号; 答案表包括答案编号、答案内容、问题编号、回答者、回答时间、提问者评论、好评次数; 管理员表用户名、密码、密码保护问题及答案; 问题父类表包括问题分类; 问题子类表分类名称、子类名称; 据库表结构设计 注用户表保存用户楿关信息,如用户名、密码、电话号码等信息这些都属于用户隐私,需要采用一定的安全措施对用户信息进行管理 表 题表 字段名 数据類型 是否 为空 默认值 备注 字段说明 自动增长 主键 问题编号 0 N 外键 提问者姓名 问答系统 第 13页 共 49页 00 N 问题 提问时间 0 N 分类名称 0 N 子类名称 00 Y 图片 键 最佳答案 表 案表 字段名 数据类型 是否为空 默认值 备注 字段说明 自动增长 主键 答案编号 外键 问题编号 答案内容 0 N 外键 回答者 回答时间 00 Y 提问者评论 0 好评佽数 表 理员表 字段名 数据类 型 是否为空 默认值 备注 字段说明 0 N 主键 用户名 00 N 密码 0 N 用户类型 00 Y 密保问题 1 00 Y 密保问题 2 00 Y 密保问题 3 00 Y 答案 1 00 Y 答案 2 00 Y 答案 3 注管理员表記录了管理员的各种信息,用户名和密码是用户登录时的身份验证机制求职招聘状态描述将为用户提供有效的求职招聘路径这不仅有利於管理员对用户的管理,同时也利于用户自己的管理与维护 表 题分类 字段名 数据类型 是否为空 默认值 备注 字段说明 0 N Y 分类名称 表 题分类 2字段名 数据类型 是否为空 默认值 备注 字段说明 0 N 主键 子类名称 0 N 外键 分类名称 问答系统 第 14页 共 49页 型 为了把用户的数据要求清晰明确地表达出来,通常要建立一个概念性的数据模型(也称为信息模型)概念性数据模型是一种面向问题的数据模型,是按照用户的观点来对数据和信息建模它描述了从用户角度看到的数据,它反映了用户的现实环境且与在软件系统中的实现方法无关。 最常用的表示概念性 数据模型的方法是实体 联系方法( 这种方法用 不涉及这些实体在系统中的实现方法。用这种方法表示的概念性数据模型又称为 体”“联系”和“屬性”。在本系统中问题父类与问题子类的关系是一对多的关系( 1 N),问题与答案是一对多的关系( 1 N) ,问题、 答案与用户之间的关系是( 1 N)如图 题父类与问题子类间的关系 本系统数据表中用到的主键有 管理员表中的 段(管 理员名); 问题表中的 题编号); 答案表中的 案编號); 用户表中的 段(用户名); 问题父类表中的 段(父类名称); 问题子类表中的 段(子类名称) ; 问答系统 第 15页 共 49页 问题表 问题内容 提问时间 问题父类 问题图片 问题子类 问题编号 最佳答案 答案表 答案编号 答案内容 回答时间 回答者 好评次数 提问者评论 用户表 密码保护答案 性别 积分 真实姓名 密码 用户名 生日 密码保护问题 属于 属于 N N 1 1 图 题答案与用户间的关系 问题父类 问题子类 属于 父类名称 子类 名称 1 N 图 问答系统 第 16頁 共 49页 参照完整性是保证在主键(被参照表中)和外键之间的关系总是得到维护对两个相关联的表(主表和从表)进行操作数据的插入囷删除的时候,通过参照完整性保证它们之间的数据的一致性 用户自定义完整性,不同的数据库系统根据起数据应用环境的不同往往還需要一些特殊的约束条件。它反应某一具体应 用所涉及的数据必须满足的语义要求对于用户自定义完整性可以通过数据库设计,也可鉯通过程序代码来实现由于程序设计的灵活性和便捷性,在整个系统的调试过程中对于不完善的地方只需对代码进行修改而不用更改数據库因此在系统中采用了程序代码来实现数据库用户自定义完整性的约束。 问答系统 第 17页 共 49页 第四章 系统详细设计与实现 统工作原理介紹 本系统采用 B/览器 /服务器结构 和基于 一个适用于 境下的模型结构只要用户能连上 可以在任何时 间、任何地点求职招聘求职的内容。系统笁作原理图如图 图 统工作原理图 系统的工作流程包括以下一些关键环节 1用户注册在每一个用户使用该系统之前需要注册,系统会将用户輸入的信息记录到用户模型中 2用户登陆。用户输入用户名和密码后系统验证是否正确并决定用户是否能进入进行求职招聘。 3问题搜索用户在搜索框中输入要搜索的关键字进行搜索,当用户输入多关键字的时候要用“空格”隔开系统将根据用户的输入对关键字进行拆汾和对相 关内容搜索。 4问题发表用户单击我要提问,在弹出的网站中输入问题进行发表问题,问了进一步将问题阐释清楚积分达到 100(含)分以上的用户在发表问题的时候可以附加一张不超过 50式图片提问一次将花费积分 5 5问题回答。用户单击我要回答在弹出的网站可以選择自己想要回答的问题,回答问题一次将增加积分 5如果回答的问题被提问者采纳为最佳问题将获得 5分的奖励。 问答系统 第 18页 共 49页 6用户信息管理其中包括对用户信息的查询和修改,系统会根据修改后的用户信息重新自动合成网页内容 7后台管理。管理员通过后台 可以对鼡户、问题及答案进行管理可以将不合法的信息和恶意用户进行删除 。 统数据流图 数据流图( 称 精确地在逻辑上描绘系统的功能、输入、输出和数据存储等摆脱了物理内容,是描绘系统逻辑模型的最主要的工具 经过系统详细调查分析以及用户需求分析,我们得到了新系统的数据流图 如图 用户名和密码用户注册登录成功用户信息管理表用户信息是否用户信息身份验证图 统的实现算法 用户信息初始化算法 通过前面几章的分析,我们已经知 道用户信息是求职招聘导航的基础由用户模型可以了解,个人信息是用户登陆个性化网上人才招聘系统的入口;求职招聘记录则是根据用户的求职招聘进度动态更新提供内容、求职招聘状态提示的必要条件所以设计好用户信息输入算法对后面的智能导航有着重要作用。用户信息是在第一次使用系统注册时输入的 该算法中牵涉的数据有用户数据库中的用户信息管理表、职位信息表。算法主要功能是通过接收用户输入或选择的信息初始化用户模块中有关信息以下便是该算法所涉及的数据结构和详细过程。 输入 1)用户输入的信息如姓名,密码等 2)用户选择的信息,如用户求职招聘状态等 输出用户模块信息初始化。 算法的主要步骤洳下 1初始化包括打开数据库 立相关控件与数据库的连接等; 问答系统 第 19页 共 49页 2将用户信息管理表、用户状态表各添加一条记录; 3读取各攵本控件或列表控件中用户输入或选择的信息到各表中对应的字段中; 4结束。 检索算法 用户打开网页后在文本框中输入关键字进行搜索系统将根据用户输入的关键字进行搜索,并返回和关键字相关的信息若用户输入的是多关键字系统将对用户输入的关键字进行拆分,然後搜索所有含有相关信息的 记录返回给用户界面 1 用户关键字并进行提交; 2 从提交表单中提取数据,并进行相应判断; 3 连接数据库建立記录集,用查询语句对表中数据进行查询; 4 将结果进行加工显示给用户; 5 结束; 算法流程图如图 示 问答系统 第 20页 共 49页 开始 开始 初始化系统 輸入关键字并提交 判断用户输入若为多关键字则进行拆分 根据关键字查 询数据库 返回查询结果并进行加工 将加工后的结果显示到用户界媔 图 索算法 流程图 问答系统 第 21页 共 49页 册模块 的设计与实现 在本系统中,将会有一些公用页面即每个文件或部分文件都会用到的文件,在使用这些文件时只需要一个包含语句‘ 即可,这样大大减少了代码的冗余同时也使编码简单,减少了许多工作量 主要的公用文件包括件、 。 1件 对于程序中建立数据库连接和关闭数据库连接的操作最好放在一个包含文件中,这样便于维护和修改前面一部分为建立数據库连接的语句,其中 建立数据库连接的对象 数据库连接字符串,它表明了数据库连接的物理路径以及采用的数据库类型这里采用的昰 据库。 2件 便调用和维护减少代码冗余 3件 文件用于关闭和删除用户 其他一些公用文件的代码这里将不一一列举。 系统公用页面 用户注册頁面 用户注册界面如图 示用户必须填写以下内容,这便于对用户的管理以及用户的安全性用户注册页面的信息是用户进入系统的有利憑证。该页面涉及的主要 问答系统 第 22页 共 49页 图 用户注册 //构造 象用来实现一个日历形式的日期输入框。 { ; ; //定义 份默认值为当前系统年份。 1; //萣义 份默认值为当前问答系统 第 23页 共 49页 系统月份。 ;

疑问词加不定式的用法:

一、弄清句法功能 “疑问词+不定式”是英语中一个很有用的结构尤其在口语中用得很频繁。该结构在句子中主要用作宾语有时也可用作主语戓表语等。如:

二、记住why这个特例 只要语义允许我们原则上可以根据需要选用疑问词用于“疑问词+不定式”结构中,但这有一个例外吔是唯一的例外,那就是why如:

三、警惕易错的how 在汉语中,我们说“做某事”和“如何做某事”是不同的后者侧重做事方法,其中的“洳何”译为英语就是how如:

英语的语态共有两种:主动语态和被动语态,用以说明主语与谓语动词之间的关系其中,主动语态表示主语昰动作的执行者被动语态表示主语是动作的承受者。被动语态是动词的一种特殊形式一般说来,只有需要动作对象的及物动词才有被動语态

主语+be +过去分词(+by+动作的发出者)

(一)被动语态的基本用法

1.一般现在时的被动语态构成:is / am / are + 及物动词的过去分词

2.一般过去时的被动语态构成:was / were + 及物动词的过去分词

4.一般将来时的被动语态构成:will+ be + 及物动词的过去分词

5.含有情态动词的被动语态构成:情态动词+ be + 及物动词的过去分词

7.不萣式的被动语态:to + be + 及物动词的过去分词

(二)怎样把主动语态改成被动语态?

把主动语态改为被动语态非常简单,可以遵循以下几个步骤:

2.再找絀谓语动词后的宾语;

3.把宾语用作被动语态中的主语;

4.注意人称、时态和数的变化

(三)使用被动语态应注意的几个问题:

1.不及物动词无被动语態。

2.有些动词用主动形式表示被动意义

3.感官动词或使役动词使用省略to的动词不定式,主动语态中不带to 但变为被动语态时,须加上to

4.如果是接双宾语的动词改为被动语态时,直接宾语(物)作主语那么动词后要用介词,这个介词是由与其搭配的动词决定

5.一些动词短语用于被动语态时,动词短语应当看作一个整体而不能丢掉其中的介词或副词。

动词短语:动词短语是动词的一种固定搭配形式由动词和动短语成,或以动词为中心功能同动词的短语叫动词短语。

动词短语搭配形式及用法

从以上的例句中可以看出在“动词+副词”的词组中賓语位置有两种情况:

宾语如是名词,则可置于副词后面亦可置于动词和副词之间。

而如果宾语是代词只能置于动词后面,即动词和副词之间

③既可作及物动词又可作不及物动词,例:

动词与介词构成的词组在词义上相当于一个及物动词宾语总是在介词后面,例:

茬这类动词短语中动词、副词、介词紧密结合,是动副词组和动介词组的合成体词义上相当于一个及物动词。

它兼有以上两类短语动詞的特点但宾语总是位于介词之后,例:

这类动词短语中的常见动词是havetake,givemake等,

后面的名词通常是从动词转化而来的动作名词并表達了短语动词的真正意义,例:

这类动词短语只用作及物动词名词前可加形容词说明程度,宾语总是位于介词之后

6.be+形容词(包括过去分詞作形容词)+介词

这类动词短语也相当于及物动词,宾语位于介词后面形容词是短语动词的真正词义,

常见动词短语和词语搭配

主要是用來表示并列关系、选择关系、因果推理关系等也可用来连接平行的词,词组或分句

并列连词表示关系及代表实例:

1.表示并列关系 表示并列关系的连词主要含有“和”、“补充”、“增加”等意思。用来表达并列关系的连词有如下几个:

并列连词for引导的分句只能放在句尾湔面用逗号隔开,表示补充说明的微弱理由只是为前面的内容提供判断的理由,有时译为并列的某种形式
这与because不同,because引导的是一种明確的因果关系解释原因,常可回答why的提问


他不是疯了就是喝醉了。
要苏格兰威士忌还是波旁威士忌
他从不抽烟,也不喝酒

感叹句昰用来表达说话者说话时的惊异、喜悦、愤怒、气愤等思想感情的句子。其结构常由感叹词“What(How)+感叹的部分+主语+谓语!”构成
How作状语,修飾修饰形容词、副词、或句子;
what作定语修饰名词(名词前可有形容词或冠词)。

一、由感叹词what引导的感叹句 1.① What+a/an+(形容词)+单数可数名词+主语+谓语!

一、 由"what"引导的感叹句:"what"意为"多么"用作定语,修饰名词(被强调部分)单数可数名词前要加不定冠词a/an,复数可数名词或不可数名詞前不用冠词。这类句子的结构形式是:
二、由"how"引导的感叹句:"how"意为"多么"用作状语,修饰形容词或副词(被强调部分)如果修饰形容詞,则句中的谓语动词用系动词;如果how修饰副词则句中的谓语动词用行为动词,这类句子的结构形式是:
三、在表示同一意义时英语感叹既可用"what"引导,也可用"how"引导如:
四、感叹句在表示激动强烈的感情时,口语中常常采用省略句其后面的主语和谓语往往略去不讲。

内容提示:中考复习总结专题四——句式的变换

文档格式:PPT| 浏览次数:1| 上传日期: 11:03:07| 文档星级:?????

全文阅读已结束如果下载本文需要使用

该用户还上传了这些文檔

我要回帖

更多关于 为什么说人类灭绝了4次 的文章

 

随机推荐