春暖花开 发表于 2016-1-5 22:27:01

XML概念模板2.0与AI代码设计

本帖最后由 春暖花开 于 2016-1-5 22:30 编辑

         XML概念模板2.0与AI代码设计

第一节 具体概念苹果
还是从苹果概念开始:苹果是一个具体概念,可直接生成实例,反应了一种最普遍,从具体事物直接抽象过来的信息模版。*什么是具体(抽象)?不想过多讨论。在此仅提出一个区分抽象具体的明确标准:具体就是存在于确定时间或空间的事物,时间和空间越明确,就越具体。反之关联的时间和空间越笼统的信息,就越抽象。更多讨论见《原理》。

1.1苹果概念主要内容有三个主要部分:1、<概念>结构,这部分内容描述了苹果作为一个概念,它的上下级结构,从而体现它在概念体系、语义体系之中的位置。<上级概念>中的内容(水果),类似一个比较明确的链接,指向父概念。苹果概念2.0版最关键的修改,是确立了以<概念>作为第一部分的重要结构(曾经写为语法,内容也有差异)。XML文档中的<概念>结构还充分体现了概念模板的建立过程。也就是说,概念结构的生成标志着对知识的认识形成了概念模板,这个概念标签就是概念信息报最直接最明确的标志。原来可能只有一些简单属性,或一些经验和实例,由于认识的深入,添加了概念结构中相关内容后,即形成概念(的雏形?),可以按照概念的方式来理解和使用了。与词汇有关的内容,也放在这一块。        2、<内涵>结构,在这里事物的各种性质、属性的集合即内涵。在这个结构中聚集了苹果形象(分部位、含形状、颜色、尺寸)、物理性质、运动和功效等。内涵中的属性基本上也是社会和文化所公认的知识。       这些属性,反应了人们认识事物时,一些最普遍的方式和结果。 3、<经验与实例>结构。       这个结构的内容可以望文生义,即“我”(个体)所了解到的,与苹果有关的具体知识。对于人,最典型的是亲身经历,眼见手摸;对于没手没脚的AI,最多只能从文本描述中获取,有时为了高仿人类,只好考虑吸收第一人称的描述文本,日记之类的用来模拟了。       实例中内容是流水账般的扁平格式,为实现一致性采取类似“情境包”的简化结构,是一系列情境元素的罗列(集合)。这些元素隐藏的背景,就是“我”,与“我”关系的关系,用来源来描述(亲见、听说、阅读到、想象、推测等)(在《原理》文中有一章讨论情境的数据结构)      
1.2概念结构体现逻辑我们可以看到,概念的子元素和内容之间,直接体现了清晰的逻辑关系,通常是属性名与属性内容的关系。苹果的口感 是/有酸,甜苹果的营养结构是/有 糖分...苹果的概念最后修改是20130613苹果的大小是8cm~20cm,典ì?型¨a12cm苹果的实例2印象  某天某地 吃了一个………..
大多数句子比较通顺,某些不太通顺,但意思也相当明白。可以看出,这是通过精心打磨修订形成的.
子元素与子元素之间,逻辑也比较清晰,下级的子元素通常是上级的一部分,同一上级元素的子元素之间常为并列关系;不过子元素的内容是抽象性质,这些关系在关于苹果的知识中通常用不着,但会体现在关于空间-视觉-“概念”等其它的抽象概念中,因此不在这里讨论。
内容与逻辑:<概念>部分描述与这个概念有关的概念,与本概念有关的词汇,因此体现了概念之间的逻辑,概念与相关词汇的关系;<内涵>部分,描述(概念指称的)事物的内在逻辑,常见包括属性、运动、结构等。<实例与经验>描述概念生成的对象,在具体时间空间的存在和运动,还有与“我”的关系。
1.3逻辑的通用表达:苹果XML中概念和内涵,甚至到经验,其理解都通过读写句型来实现,如上一段中的举例可见,”是”和”有”,两个谓词,适用于表达很普遍的逻辑判断,因此我们确认以此确认概念的通用表达式如下:
A1通用表达方式:[概念名]的[标签]是/有[标签的内容]       一般地(还不知有没有特殊的),概念名是XML文档的根元素,且次一级包含了<概念>的子元素;       标签即子元素,无论哪一级,子元素的全称与应该是父元素一级一级、带点号的;但通用表达之需要最后一级;标签的内容即子元素下的innertext。        标签内容通常以顿号隔开,代替隔开的内容之间都可以作为独立值来表达。       逗号之间如果一起列出来,可用或来代替逗号。       如果逗号内容未全部列出,或者用“等”        举例,苹果的口感 是/有酸,甜        通用表达句式非常直接-清晰地体现了思维时读出概念的内容,是贴近原始思维过程的格式。所以它的作用是双向的,不但用于读出,同样也可用于将未知(且可信)的知识写入概念模板。       比方说XX(也是水果吧)有红色的(且来源可信),通过搜索XX的颜色属性,如果原来没有红色的内容,那么可以写入红色的内容。        1.4自然表达          通用表达的意义和逻辑一般清晰明确,但往往不够口语化。如 1、   苹果的[上级概念]是水果。 显然,不如说:苹果是一种水果。   
是一种、属于可以视为为同义表达(词),但“是”的含义较多和“属于”不一定是同义(词)。       大量标签可以省略,包括上一例“上级概念”。       苹果是红的;苹果是圆的;这里颜色和形状的标签可省略 2、苹果可以/能吃、加工、生长。(“可以、能”主被动都可以)  苹果会生长。(“会”字仅能主动的活动)即运动与功用(用途)这个标签下的内容,以通用句式表达意思清晰但不自然。 3、特殊内容:空白blank,不关心,未知,各种(XX)。通用表达基本可用于特殊内容,删掉“是/有”就是很好的自然表达格式。 4、<经验与实例>中的内容,通用表达式为:苹果的{实例2号}是“某天,某地,我吃了一个”,意思不难明白,但很不通顺(象抗日剧对白?),需要经过表达转换。比方说,把实例X号改为”我知道”,”我记得”,或者把子元素名直接清掉,就通顺多了。(注意逗号的含义与顿号不同,表示实例中的内容只有一条,各元素是一个整体) 思考:1:要不要把表达句式直接写入XML文档的适当位置,置于哪一层标签中最好呢?2:描述表达句式,需要什么特殊字符集呢? 思考1我的结论 除了概念名的同义词近义词用<文字标识>(下回直接改为同义词)的内容写入概念之外,原则上不把句式词汇写入概念XML文档中.第一步先用通用表达方式读出,第二步再建立使用名为”自然表达”的方法,对通用表达句式进行替换.这样算法步骤无明显增加,而更利于表达的集中管理,且符合人的思维方式.        1.5简单的理解与表达       理解与表达是过程的两个阶段,可以视为差不多是互逆的过程。表达是读出输出;而理解是确定搜索读写的目标,即从触发的句式中挑出搜索的关键字,含概念名/属性名(可选)/谓词(决定搜索方式),根据关键字搜索到概念文档和属性节点。显然 举例:苹果是什么样子?这个例子中需要识别了苹果,样子,有同(近)义词表的替换,即可将“样子”转换到“形象”。“形象”本身是个抽象概念。在苹果概念中搜子元素名有形象结构部分,但“形象”概念中没有苹果的内容。因此我们显然应该读出苹果的形象(一般读不出形象概念中的苹果)。”是什么”这个谓词确 认搜索-读出内容的这个操作准确无误.谈谈、说说XX(概念名)/知道XX吗?  也能起到类似作用。疑问的词汇最基本的用途,是表征一块空白内容等待搜索后写入。象“苹果(的颜色)是红的”,没有疑问词的句式,则无须读出的反应。
反向搜索或自由搜索的理解,例如不触发从根元素的苹果到结构名的关键词,而是给出某些内容,正好在苹果概念中可以搜索到。如红,搜索苹果概念时,可以得到红是苹果的颜色;谈到果肉,可以搜索到苹果(也)有肉。这种搜索答案不是必然地,但正好体现了 联想的思维方式。       红.......(AI搜索到/想到了)这是苹果的颜色。       反向/自由搜索配合较丰富的表达句式,拟人效果十分明显。 第二节:   抽象概念 使用物体概念,作为抽象概念的基本例子,对代码设计进行讨论。

2.1抽象概念是对具体概念的属性等单独抽出来形成的结构,通常总结与时空无关,和个体无关的,一些元素/属性的规律性的相互关系.特别是纯粹概念之间的关系,基本上在理论性概念中描述.当搜索在理论概念中进行,那么理解就达到了理论层次,理论层次描述讨论的都是抽象的概念,而不是具体的事例和情境.具体概念可以直接生成对象,也就是说,具体概念可用一个,两个来讨论,或在某时某地,或与其他具体的东西一起...。抽象概念一般不行。物体是一个抽象和具体内容结合的概念,它描述了众多子概念的共性,一般情况下作为抽象共性来使用,但在一些具体场合,在无法确定某个对象属于哪个子概念,只好直接用物体直接生成对象.例如,黑夜里发现对面有个东西,一晃就不见了.物体概念虽然并非纯粹抽象概念,但它的属性内容是思维中被使用最多。特别是物体的分类。              2.2物体概念结构简介       与苹果概念类似,也有概念-内涵-实例与应用三个部分:       三个部分功能基本相似,以下细节有所不同:       a内涵中增加了语义部分,因为具体概念的意思,靠分类/形象什么的,基本就明白了。但抽象概念往往可以从多个常人未形成共识的角度说明。比如物体在物理上的意义,物体与物质的关系等。       b苹果中的上级概念,物体这里称为上行概念。因为物体上级没有父概念,但物体还会在某个理论中占据一个地位,或者说它是某个理论的一部分。上行概念描述这种抽象关系。       c物体的<实例与应用>,结构域具体概念类似。由于物体是一个禁锢具体和抽象的概念,所以其中<实例>是相同的,都是作为一个具体的一个对象;而<应用>,则是作为理论的一个思维过程,比较典型的应用情况是:某物体重2kg,用2牛顿的力推动,结果如何如何(加速度=1m/s2)。              2.3物体的分类结构       物体作为抽象概念,在上级的物理理论中占据地位,它直接和空间、测量什么的抽象概念和互动发生关系;它的属性更是一系列物理定律的元素。但在常识和生活中,这一类抽象还不是最常用的。所以这些抽象关系在物理的概念中描述,在物体概念中仅体现为< 上行概念>的内容是“物理”即可。              常识中谈到物体,使用最频繁的内容,应该是物体的分类结构。我们使用这个分类结构来管理无数关于物体子概念类型;物体的子概念可能达到上百种,但我们可以毫不费力滴理解到这些子概念都属于物体这种实实在在滴东西,具有大小质量形象成分等统一属性。在XML概念模板中,我们也能让AI通过具体概念的<上级概念>和物体的<分类>两种子元素理解整个物体概念的分类结构。        物体概念的分类结构描述了一个庞大的子概念体系。在这个系统支持下,物体内涵中的形象、质量、运动等属性,被物体的子概念群所继承。子概念中作为物体共性的信息结构,可以隐藏在上级的物体概念中,需要时再复制过来。在基本常识领域,物体内涵中的属性,至少能为各级子概念节省1/3,甚至1/2的信息。        2.4分类格式讨论物体分类结构不但会关联到很多其它概念,而且使用中(自主学习)时它本身也可能频繁更新,因此编写时需要精益求精.特别有必要方便实现多层扩展。分类有多种标准,起初每个标准的分类只体现了一层,后来考虑自主学习,很有必要延伸为多层.那么分类中的某个具体内容,都既有可能作为text,也有可能作为下级子元素标签继续分类.例如分类3的食品.
既然分类结构中的text内容将普遍作为标签,那么分类标准,可以两种方式处理:1、改为属性,(分类)标准=”xx”,这些对子元素进行修饰的内容均使用元素,而不用标签了.2、如果坚持扩展性方便,而坚持使用标签,那么由于分类标准和二层分类都要形成标签,苹果概念所示的通用表达将成问题,需要考虑在某些标签前面加上特殊字符,来形成另一种表达句式.   在物体概念的<概念>-<分类>中,为确保编程可控;目前仍以多类型,一层次为好。更复杂的结构,放在实例与应用中尝试。
第三节:语句表达        “表达”概念的必要性       某些句式强烈而明确地要求AI打开要求的概念,比如是AA是什么,你知道AA吗等,AI不但必须识别这些句式,而且需要组织整理这些句式,第一步相同相近含义的句式应形成一个组。 触发理解的句式和表达输出的句式包含一些可逆的过程触发和表达的主要内涵都是一些正则表达式的集合.有必要建立这些对应关系的集合。依托表达的模板可以进行句式学习。 表达是抽象概念,可能是语法领域使用最频繁的概念,之前由于思路侧重于将表达句式分置于各具体概念,对其重要性有所忽略。在编程实践中发现,最常用的逻辑句式变换,比如“是、有”之类的思维动词,有必要将句式独立出来。很多暂时没有归属概念的句式,也可以存放在表达这个概念的应用部分。
“表达”概念描述V0.8:
概念部分,描述表达在概念体系中的位置,上行概念语法。作为常识,表达在语法中的位置应特意写的层次扁平一些。
表达的内涵,大致模仿动词的过程结构。大致会有句式搜索、态度、语气添加等,既然普通人(包括我自己)都不太明白,那么先空着也没问题。最后表达的结果(目标?状态?)是恰当有效。
表达的<概念>和<内涵>,在V1.x版之前都是虚的,随意的,由于不着急讨论表达在语法中的地位所以基本无需关注的。而它的<应用与实例>这部分能够支持对大量日常概念的读写,才是AI编程急用的关键,主要描述一组一组的、意义相同(相近)的句式。每一组句式会有一个主句式,直接体现从XML概念搜索时的节点路线,或者概念之间的关系,可叫原始逻辑句。既然是立足编程,那么原始逻辑句中的内容就是概念内部节点-内容的通用表达式,或概念之间的某一类搜索线路。而其他意义相近,由自然语言习惯变形的句式,叫做自然(表达)句式。
我们先看看前面搜索“苹果”概念时,已经使用过的逻辑通用表达式,核心谓词为“是”和“有”,描述了从概念名(filename?root?)/标签名(nodename/item? )/到内容(text?)的语义关系。其中nodename的差异带来不同的描述表达句式。好在各种常用概念结构相似,nodename的数量不多(100?200?),因此句式的表达复杂度并不高。比如前面举例,将{运动与功效}替换为可以,能;{实例与经验}可以替换为“我知道”…    (句式)表达的概念,将搜集数以百计的句式结构组,对句式的意义进行整理分类,在这些数据的支撑下,AI将对未知句式进行识别推测,通过反馈进行句式的学习 举例我们已知“苹果的{运动和功效}有吃”,“苹果能吃”,但第一次听说“苹果可以吃”,由于没有太多别的词,那么搜索到苹果和吃的内容,就会推测这句话的意思是“苹果能吃”,通过发问获得肯定后,就可以在“(句式)表达”这个概念模板的 帮助下,学到“[名词]可以[动词]这个新的句式表达”。             句式表达的正则表达式      句式中的关键词往往是分离的,中间插入的内容也往往差异很大,关键词和插入内容容易混淆。主逻辑句式中的关键字则关联到XML数据结构,为了精确描述表达句式,需要研究正则表达式,在正则的基础上添加一些特殊字符作为标识,准确区分关键字(谓词),可替换内容,还有XML的逻辑结构。      通过特殊字符,将表达式做出标记,在内部搜索过程中使用,是十分必要的。比如前面讨论的句式“XX可以吃”是什么意思,引号其实是句式的标志,说明作者一段话是一个整体,一个特殊含义。如果对话中没有加引号,那么AI应该从后面的什么意思中发现前面是一个句式,在内部逻辑中加上引号,然后写入表达概念的<应用实例>;更具体地,在表达概念的应用中,就应该把“XX(或+其他词)的意思是”的句式形成逻辑,指向<表达>.<经验与实例>.<表达式>的内容。        通用表达的格式:通用表达方式作为中间步骤,保留标签的尖括号<运动与功效>,一应该概念id如<@gn苹果>进行标注,不仅替换时准确方便,而且这个格式可用于逆过程,即学习时可能会有机会把”可以”或”能”替换为<运动与功效>,反过来写入概念模板的空白位置。*补充说明:由于尖括号在作为内容被写入XML文档时会引发混乱,还是把尖括号替换为另一个字符为好,比如全角半角一致的{ }。如果与正则表达式的括号发生混淆,那么就用括号+字母的方式。
理解:AI正确选出句子中的几个关键词,打开关联的概念,读出或写入概念适当的内容,即实现了正确的理解。理解需要通过关键词进行触发。狭义的理解也即将词汇触发引导到相关的概念,然后读出相应标签中的条件。
第四节逻辑与理解/        苹果的概念中已经提及了逻辑和理解,这里做个小结并深入讨论。直接逻辑:最具体普遍的苹果概念,也浓缩了相当深层的内涵,能体现以下逻辑结构,在此做一个小结:      概念中的<概念>结构中,主要体现抽象逻辑,即苹果的父概念可以从水果,一直向上,关联到物体;苹果的子概念,向下比较明确的有品种,模糊的可以随时以口味、颜色来分类。       概念的<内涵>结构中,体现常识性的知识结构,具体概念的内涵主要是形象、运动功用、属性等。       <实例与经验>中,主要体现了我对具体的苹果的了解,目前主要通过时间经历和印象两种线索进行记忆。       所有直接逻辑都可以用【概念名】的【结构名】是/有【内容】来表达。这个基本表达式,随着【结构名】的变化,会生成非常丰富的自然表达式,比方说XX的意思是什么,XX的运动与用途是什么.............由于在输入文本中使用的都是自然表达式,所以有必要在<表达>的概念中描述这种丰富的转换关系。                   如果谁发现哪位邻近节点之间的没有明确的联系,那么谢谢,你为AI的抽象理解找到一个很好的问题。              隐含逻辑:       以上结构还仅仅是从子元素到内容之间的关系。其实XML概念模板还隐含着更多类型的逻辑关系:       上下级子元素之间,就隐藏着抽象逻辑。比如形象元素,下属大小、颜色、形状,是认识苹果的抽象逻辑内容。这一套逻辑结构会在物体类中反复运用,可以视为经验类逻辑;在形成视觉概念,给形象一个明确地位和规定之后,对形象的认识就上升到理论地位。因此,子元素之间的逻辑关系,会在理论概念中更直接地体现。       平级的子元素之间,同一子元素之下的内容之间,也形成并列关系。概念内涵中的内容(innertext)列举了常见的多个属性值,而实例中具体的事物则通常选择一个值。那么多个属性值的关系在实例中出现,就隐含了概率逻辑。比方说,已知aa概念中颜色有3种,那么某个具体的aa,颜色应该是什么?这类问题可以做一个通用的回答。       【概念名】的【结构名】,与【内容】的对应关系,就是一个完整的逻辑结构 。如果这个结构已经建立,那么已知【概念名】的【结构名】,或者【内容】,都能搜索到另一部分。但【结构名】就不是直接的逻辑,在使用【结构名】的概念中,不能解释【结构名】是什么意思。       比方说,物体概念中的形象-颜色的【结构名】怎样解释呢?只有在额外的理论概念<视觉>中,把形象作为【内容】,用一个新的【新概念名】的【新结构名】是【内容=结构名】,才是解释形象的逻辑意义。        实例与经验的内容之间,隐含着时间空间与认知主体的逻辑:经验的内容中必须包括时间和空间(哪怕是模糊的不确定)的,其他所有内容中包括活动(动作)对象,属性值,都被包裹在时间和空间中;经验内容中本身就隐含着我知道,还可以包括更明确的感受和体验,包括我喜欢,我被迫,我关注等。       关键词的搜索:为了使AI的理解流程更为简单清晰,在此详细讨论找到关键词后,如何通过搜索的方法来触发已掌握的包(含概念、情景等)。一个关键词经同义词转换后,可能在概念名、概念的标签、情境的主要元素等各种不同位置搜索到,形成不同的理解。更具体地说:搜到这个词是一个概念id,那么可以对这个概念有较全面的理解;搜到它是一个(或多个)概念的子元素名,那么它是一种认识的结构;搜到它在情境中,那么说明AI拥有关于它的一些经验。在多处搜索到它,说明AI拥有从理论到应用的多层次理解。同一单句中的多个关键词,通常以“和”的关系作为目标,当多个关键词出现在同一数据结构中,那么就是很准确的搜索结果;位置越近的区域,理解的逻辑性就越强,意义就越明确。搜索不仅局限于同一单句,段落中所有关键词,通常也应该大部分都围绕同一主题,即落在某一组数据结构中,或者以某一数据结构为核心。      理解的深度,取决于搜索的范围,和搜索后逻辑的延伸。       搜索不会仅仅限于单个结果,也不限于以确定的那几个关键字为目标。比方说,搜到的关键词是一个概念,不仅会读出自身的内容,还很可能上行读取其理论概念的内容;或者从内部内容中如经验实例,找出新的关键词,讲搜索推进到外部的其他概念或经验。               拟人模糊理解              概念-情境的数据结构是拟人思维而建,有效体现了人类认知逻辑的线路,支持知识的学习,同样也会自然地产生拟人思维的模糊效果。当概念-情景的数据一般滴丰富就会充分体现。下面简单讨论,当然你得先假设并想象我们建成了一个比较丰富的概念库和情景库,且得到常用字典和词汇表的支持。       情况1抽象事物的模糊逻辑(理解):某些句子和段落,关键字散落在比较广泛的领域,那么连接这些关键字的线路要跨越概念之间,以某些理论概念或者情境作为中转,这样往往会有2条或更多选择。于是多种可能性就产生了。举例:       情况2多意词汇的模糊理解:可以在不同的数据单元中搜索到这些关键词,比如“搞定”这件事情,搞可以代替各种 动词,因此与这件事情有关的动词都要进行搜索,可能形成很多的逻辑线路       情况3自由搜索带来的模糊理解:“想想美好的生活吧”。美好生活的内容情景很多,由于限制不足,搜到的内容很多,或者每次搜到的都不同。              由于搜索的结果不唯一,那么搜索内容存在不确定性,知识库的频繁更新也增加了不确定性。跨越的节点越多,逻辑的路径的模糊性越明显。在拟人概念的XML数据结构支持下,多结果搜索的逻辑轻易打破所谓AI)计算机没有模糊逻辑的肤浅偏见。 第五节:基于模板的疑问与求知        模板的复制       掌握了一个概念模板,就有可能对同类的知识进行学习。比方说苹果是一种水果。那么当了解确认到“XX是一种水果”的时候(比方说一个可信的账号作为老师进行教学模式对话,或者输入百度百科之类的文本),如果搜索到自身原来没有一个叫XX的概念,那么就会自然而然地打开苹果模板,将其中苹果概念的根元素替换为XX,除<上级概念>外,其它内容也全部清空,可保留其它结构,另存为一个名为XX的水果概念。       对于抽象和半概念模板,由于概念整体结构类似,子元素-内容的逻辑关系类似,通用表达式格式类似, AI同样可以通过对话识别关键词搜索,来确认语句的讨论属于理论概念,因此复制-形成新的理论概念模板不存在困难。不过,由于一个完备的理论概念,其中各项子元素及其内容,都应该是已经建立的概念。所以要形成一个真正完备的理论概念并不容易。        空白产生疑问       新的概念模板刚刚形成,除了从上级(上行)概念继承来的内容通常几乎所有的内容(子元素的取值)都是空白,所以我们仅仅知道有这个概念,但其实并不了解这个概念。参考人类的思维方式,每个结构都应该有对应内容,空白的内容(AI)自然产生疑问,迫切需要减少空白,尽可能填充这个概念的一些内容。于是使用通用疑问表达式发出疑问句式,就是一种选择;另一种选择就是去互联网搜索一些可信的来源,如百度百科,少儿科普,围绕通用表达式分析一些简明的文本获取知识。              学习未知关键词      当多次出现同一未知关键词的时候,有必要对其进行关注学习,如果某些交流的步骤能顺利得到反馈,就能将关键词形成一个初步的概念,参考过程如下:1、    同义词(短语)询问:“Xxx(未知关键词)是什么意思?”,或者“XXX的意思是什么”,希望能从回答中得到一个同/近义词,或者一个能在概念和属性中搜索到内容的修正短语如“苹果的品种”。这样可以直接将未知词语联系到已经掌握的知识。
2、    概念模板询问:从概念体系中询问关键词在语义系统中的定位,可以询问:“Xxx是什么东西,或是什么概念?”期待对方的回答中的关键词能够帮助选择一种概念模板。如果是实在的物体类型,则可以继续询问时什么样子(形象),有什么作用。3、    一般疑问句询问:         如果的回答意义不明确,可以直接使用一般疑问句表达出AI已掌握的模板类型:到底是抽象、具体还是二者兼备?它的原意是理论描述还是属性概念还是抽象事物?这样通过不多的几次的选择,可以很快将关联到恰当的位置。                  一般疑问句的询问不限于概念模板类型,适合表达形式很多,回答的内容搜索不到的情况。
4、    结构的询问:如果AI已经掌握了类型比较完备的各种模板,各种模板中的子元素和内容的取值都得到了比较好的支持和解释,可以进行更深层次的交流,即讨论模板的内涵、应用经验等各种结构,组合成新的模板。比如各种专业理论,需要新的理论关系。              5、验证反馈:每一步知识的写入后都可以反馈确认。在不同来源中有出现相同的知识,该内容即得到验证。       反馈可以使用疑问句,比如 菠萝(的本意)是水果?...那么它有味道,它有/是果实?菠萝(一般)有多大多重?(这个问句间接证实菠萝概念中的水果属性)。       最好有教学形式的环境能及时对验证的疑问产生回答,只要有相对可信的信息源,没有老师也可以自己验证。如有百科知识的文本,对新输入知识的读出,通过关键词和自然表达式的转换后,也可以在文本库中搜索验证。比如菠萝味道是甜带酸的,有香味,都可以在百度百科里查到而得到验证:“菠萝果形美观,汁多味甜,有特殊香味,是深受人们喜爱的水果。”              在此主要以具体概念为例,讨论自主学习的过程,熟悉这个流程后,自主学习方法代码也可以进入编写阶段了。 2.5抽象概念的模板结构有了物体概念模板中分类结构的支持,对分类添加新的结构,与添加一种新的水果的概念模板,过程几乎完全相同。首先我们可以进行最基初的抽象/即分类的学习.针对一个未知的物体概念,如电器,就可以询问它是不是物体,然后通过问答来确认它在物体分类中的地位,然后按照物体分类的共性来使用它.              演绎是最广泛的逻辑方法,在学习中普遍应用。例如,AI学到一个 "任何物体都有导电性"的应用,导电性是什么回事呢?可以到导电性的概念中去查,但是很显然AI没有这个概念(既然刚接触);然后就到几个最常用的理论领域的内容中去查,如果找到,就可以了解导电性的上一级概念(即内容的标签).         如果找不到,对不起,这个属性没有得到理论的支持 .我们只知道它是物体的一种属性,将其暂时置于物体概念的"一种未得到理论(概念)支持的属性”之下,等理解了再移到恰当的位置.       如果是“任何金属都能导电”,则从能+动词的句式搜索到{运动与功效},从而给金属及其子概念的<运动与功效>添加导电的内容。       为达到这个目标,AI可以发问,导电性属于什么理论领域,与什么元素有关,(回答物理.电学领域,大体与电阻-长度 有关),这样可以确认这个新属性在理论概念中的位置.当然,也可以去查词典,从中寻找一些相关理论结构的线索。 然后,将导电性演绎到具体概念之中的时候,就能比较准确地将其置于上物理性质-电学性质一级概念的标签之下了. 第六节:客户需求描述 概述:1、前台AI对话界面和进程,AI理解并显示对话的输入输出。2、最简单的自主学习功能:对话学习、人工输入;自主搜索简单试试即可。3、后台功能菜单主要有:a显示概念树、概念内容和搜索结果;b XML文档模板的管理 ;c搜索-逻辑-理解等各种方法代码中的参数设置。 一、前台对话的主进程:通过关键词搜索的模型,来激发打开AI拥有的相关概念(目前仅讨论概念内结构),然后输出逻辑和表达。目的:体现概念体系中,对已知知识的逻辑和理解和表达。 1、分词-挑出关键词:使用最大分词法,将对话输入句子字符与词汇表对比匹配,挑出词汇表中可识别的词汇。虚词、助词也筛选出来,但不算在关键词汇中。第一阶段关键词在3-5个,不考虑过于复杂的长句。我们仅关注已知的关键词,忽略未知词和虚词。        预备工作-词汇表:整理目前拥有的所有XML文档,列出所有出现过的词汇,并标注名词动词(谓词)形成列表,这样匹配出的关键词肯定能在XML概念中搜索到;也能让词汇表和知识同步增长。       除以上得到的词汇表外,另需要增加常用虚词(助词)表和疑问词表,对分割关键词十分有效。可以在后台模板/资源管理中实现该功能。              2、句式识别:句式即特定词汇类型与关键谓词的有序排列       步骤1将输入句子排列成 关键词-虚词(助词)-未知词汇组成的有序队列后,即可匹配是否已知句式。       已知的句式在《表达》概念的应用中列出。现阶段我们掌握句式都是从“【概念名】的【结构名】是/有【内容】”这一个逻辑表达式中,经过细分、转换出来的自然表达式,关键词识别要点是中间的谓词是/有。下一步先以人工方式在《表达》概念中添加句式。              3、表达输出:        4、无句式的关键词搜索(挑战目标):确定一个句子中的几个关键词,但匹配不到句式的情况下,直接使用关键词进行搜索。       首先搜索有没有已建立的概念名,然后搜索已掌握概念名的同义词表(随手写一个以便测试),如果搜到,打开相关概念。   与某个或某种概念的特定节点/特定内容,及其周边区域的内容关联,通过搜索即可直接读出,读出后添加或简单替换极少内容即可。       c如果搜索不到,则以流的方式打开已有的少数几个XML文档,搜索文档内容。当在同一概念中找到多个关键词时,输出通用表达式,即<概念名>的       d如果再搜不到,本阶段放弃(下阶段再研究打开字典、词典,在解释语句中再寻找新的关键词。)       二、自主学习功能展示:目的:展示最简单的几种自主学习方式,证实知识自主增长的可行性。1、对话输入,关键词搜索发现新知识时写入2、人工输入一段文本,自动匹配输入句式,发现新知识3、自动搜索(挑战目标),发现新的知识句式。 三、后台XML模板的管理目的:对理解和学习的流程进行人工干预,确保知识增长的有效性       a   对概念类型和列表进行管理,即一个二维列表类文件同步记录所有的概念类型和概念名称的列表(最好使用XML)         b对辅助文档如字典、词汇表等进行管理。       利用近义词表,可大大丰富触发输入和表达输出的语句。测试时可以使用一个随手写出的“最小列表”,方便目前三种概念类型的表达和理解方法使用。预留操作空间,方便将辅助文档升级为XML概念类模板。       c显示内部逻辑中搜索到的概念和内容       d根据id分类、按时间 分类存储历史对话记录 第七节 五层逻辑,五步搜索       最后进行下理论总结。       完整的语义理解,通常由词汇、实例与经验、我的意识、具体概念、抽象概念,从下到上的五重意义,形成五层逻辑,AI也要经过5次搜索运算来实现              概念-情境的数据结构形成的在五层语义模型中,以关键词搜索到节点,以思维方法为驱动(由思维动词等相关的概念支持),在某些领域范围内,以搜索为基础并改变内容和结构,即形成有限或无限的思维。              本质上,所有阅读、输入的语言都是情景,分离认识的关键词作为情境的元素。 附件:过程测试:1、单个词语搜索2、自动生成词汇表 类设计:1、段落类:段落全文;按句号级别分复合句;按逗号级别分单句单句关键词;主语(词)谓语(词)宾语(词)

qiansi506 发表于 2016-3-1 15:27:56

顶也~~~
页: [1]
查看完整版本: XML概念模板2.0与AI代码设计