{"id":11472,"date":"2022-10-31T12:23:31","date_gmt":"2022-10-31T11:23:31","guid":{"rendered":"https:\/\/www.upm.es\/recursosidi\/offers-resources\/sin categor\u00eda\/keyq\/"},"modified":"2022-10-31T12:23:41","modified_gmt":"2022-10-31T11:23:41","slug":"keyq","status":"publish","type":"product","link":"https:\/\/www.upm.es\/recursosidi\/offers-resources\/soluciones-tecnologicas\/keyq\/","title":{"rendered":"KeyQ"},"content":{"rendered":"<h4><strong>Descripci&oacute;n de la base tecnol&oacute;gica<\/strong><\/h4>\n<p style=\"text-align: justify\">KeyQ es un sistema que permite obtener los &ldquo;t&eacute;rminos compuestos&rdquo; (terminolog&iacute;a del dominio de aplicaci&oacute;n) de un conjunto de textos (corpus). Tambi&eacute;n permite la b&uacute;squeda por dichos t&eacute;rminos, devolviendo los p&aacute;rrafos donde se encuentra dicho t&eacute;rmino compuesto, ordenados por relevancia.<\/p>\n<p style=\"text-align: justify\">La figura 1 muestra los t&eacute;rminos compuestos identificados en un corpus de 112 documentos legales en ingl&eacute;s del proyecto europeo Lynx (<em><a href=\"http:\/\/lynx-project.eu\/\">http:\/\/lynx-project.eu\/<\/a><\/em>), con el que fue probado el sistema.<\/p>\n<blockquote style=\"text-align: center;padding: 20px 10px\" title=\"Quote\"><p><img fetchpriority=\"high\" decoding=\"async\" style=\"margin-left: auto;margin-right: auto\" src=\"\/recursosidi\/wp-content\/uploads_kairos\/ficha_230\/IMG1634896208707\" alt=\"\" width=\"566\" height=\"468\" \/>Figura 1. Ejemplo de &ldquo;t&eacute;rminos compuestos&rdquo; identificados en un corpus de documentos legales ordenados por n&uacute;mero de apariciones (frecuencia), de m&aacute;s frecuente (parte superior) a menos frecuente (parte inferior).<\/p><\/blockquote>\n<p>La b&uacute;squeda por &ldquo;termino compuesto&rdquo; permite identificar las ubicaciones en el corpus mediante <strong><em>gr&aacute;ficos de dispersi&oacute;n<\/em><\/strong> como el mostrado en la figura 2. Cuantos m&aacute;s t&eacute;rminos, compuesto o simples, se a&ntilde;adan a la b&uacute;squeda, menos l&iacute;neas verticales habr&aacute; en el gr&aacute;fico de dispersi&oacute;n y, por tanto, en menos p&aacute;rrafos habr&aacute; que buscar la respuesta a la consulta realizada.<\/p>\n<blockquote style=\"text-align: center;padding: 20px 10px\" title=\"Quote\"><p><img decoding=\"async\" style=\"margin-left: auto;margin-right: auto\" src=\"\/recursosidi\/wp-content\/uploads_kairos\/ficha_230\/IMG1634896368473\" alt=\"\" width=\"566\" height=\"35\" \/>Figura 2. Ejemplo de <em>gr&aacute;fico de dispersi&oacute;n<\/em> para el t&eacute;rmino &ldquo;supreme court&rdquo; sobre el corpus descrito.&nbsp;<\/p><\/blockquote>\n<p>La soluci&oacute;n se basa en tecnolog&iacute;as de Procesamiento de Lenguaje Natural preparadas para procesar textos en distintos idiomas, as&iacute; como en tecnolog&iacute;as de Inteligencia Artificial y Aprendizaje profundo (<em>deep learning<\/em>). Se ha trabajado con textos en castellano, catal&aacute;n, e ingl&eacute;s.<\/p>\n<hr \/>\n<h4><strong>Necesidades de negocio \/ aplicaci&oacute;n<\/strong><\/h4>\n<ul>\n<li style=\"text-align: justify\">La b&uacute;squeda de informaci&oacute;n se ha convertido en una actividad habitual de nuestra vida diaria. No&nbsp; solo en el entorno laboral, tambi&eacute;n en nuestro ocio buscamos d&oacute;nde ver una pel&iacute;cula, d&oacute;nde ir a cenar, o qu&eacute; colegios tenemos cerca de casa.<\/li>\n<li style=\"text-align: justify\">Todos tenemos interiorizado el &ldquo;estilo Google&rdquo; de b&uacute;squeda de informaci&oacute;n: las palabras clave. Pero hay situaciones en las que echamos de menos que Google entienda la sem&aacute;ntica de las preguntas. Por ejemplo, si preguntamos por &ldquo;libros que citen a libros de Garc&iacute;a M&aacute;rquez&rdquo;, Google nos devolver&aacute; enlaces a p&aacute;ginas web que tengan libros de Garc&iacute;a M&aacute;rquez, en lugar de libros que citen a libros del autor de Cien a&ntilde;os de Soledad. Google no entiende las preguntas, no entiende su sem&aacute;ntica.<\/li>\n<\/ul>\n<hr \/>\n<h4><strong>Ventajas competitivas<\/strong><\/h4>\n<ul>\n<li style=\"text-align: justify\">Multiguismo: Trabaja con textos en espa&ntilde;ol o en ingl&eacute;s. Se han hecho prototipos con otros idiomas, como catalan.<\/li>\n<li style=\"text-align: justify\">B&uacute;squeda intuitiva de los t&eacute;rminos m&aacute;s usados en un corpus de documentos. Por ejemplo, en un corpus de manuales de reparaci&oacute;n de aeronaves, tenemos t&eacute;rminos como &ldquo;circuit&rdquo;, o &ldquo;gear&rdquo;. Una b&uacute;squeda por alguno de estos t&eacute;rminos mostrar&iacute;a los documentos en los que se encuentran. Sin embargo, cuando el corpus es grande, o cuando el t&eacute;rmino es frecuente, la b&uacute;squeda por palabra clave se hace inviable.<\/li>\n<li style=\"text-align: justify\">Propone una b&uacute;squeda basada en <strong>t&eacute;rminos compuestos<\/strong>. Siguiendo el ejemplo anterior, ser&iacute;an t&eacute;rminos compuestos &ldquo;circuit breaker&rdquo; y &ldquo;landing gear&rdquo;. El usuario teclear&iacute;a algunas letras de un t&eacute;rmino (no necesariamente las iniciales), y el sistema le mostrar&iacute;a los t&eacute;rminos simples y compuestos que hay en el corpus, ayud&aacute;ndole a crear una consulta m&aacute;s precisa.La b&uacute;squeda por t&eacute;rmino compuesto obtiene resultados m&aacute;s preciosos que la b&uacute;squeta tradicional por keyword (estilo Google).<\/li>\n<li style=\"text-align: justify\">Escala linealmente (usando producto KeyQ-solr) y se puede llevar a la nube (se ha llevado a Azure).&nbsp;<\/li>\n<li style=\"text-align: justify\">Protegido por un resgistro de software de la CAM.<\/li>\n<\/ul>\n<blockquote>\n<p>&iquest;No encuentra lo que busca en un mar de documentos? Nuestra tecnolog&iacute;a permite una b&uacute;squeda m&aacute;s eficiente mediante la identificaci&oacute;n autom&aacute;tica de t&eacute;rminos compuestos.<\/p>\n<\/blockquote>\n<hr \/>\n<h4><strong>Referencias previas de prestaci&oacute;n<\/strong><\/h4>\n<ul>\n<li style=\"text-align: justify\">Las terminolog&iacute;as generadas por esta herramienta alimentan el sistema KeyQ-solr, un sistema desarrollado bajo el paraguas del AInnovation center de UPM, un centro mixto de UPM y Accenture, entre 2020 y 2021. Se han presentado&nbsp; prototipos al Ministerio de Justicia y a la Generalitat catalana.&nbsp;<\/li>\n<li style=\"text-align: justify\">El grupo de investigaci&oacute;n es experto en tecnolog&iacute;as de la Web Sem&aacute;ntica y Datos Enlazados, est&aacute;ndares bien establecidos avalados por organismos internacionales de estandarizaci&oacute;n como el W3C. Estas tecnolog&iacute;as nos permiten hacer un tratamiento sem&aacute;ntico de la pregunta y proporcionar resultados m&aacute;s precisos.&nbsp;<\/li>\n<\/ul>\n<hr \/>\n<h4><strong>Protecci&oacute;n<\/strong><\/h4>\n<ul class=\"propiedad\">\n<li><strong>Registro sw <\/strong>M-007053, marzo 2019)<\/li>\n<\/ul>\n<hr \/>\n<h4><strong>Grado de desarrollo<\/strong><\/h4>\n<ul class=\"grado\">\n<li>Concepto<\/li>\n<li>Investigaci&oacute;n<\/li>\n<li>Prototipo &#8211; lab<\/li>\n<li>Prototipo industrial<\/li>\n<li><strong>Producci&oacute;n<\/strong><\/li>\n<\/ul>\n<hr \/>\n<h4><strong>Contacto<\/strong><\/h4>\n<p>Contacto KEYQ<\/p>\n<p>Mariano Rico<\/p>\n<p>ETSI Inform&aacute;ticos UPM, Ontology Engineering Group (OEG)<\/p>\n<p>e: <span rel=\"6f313630c4312131b8311f31ba313c31be310a30a43113319d31213179311b31c6312c3186311a31ab31\" class=\"cryptex \" style=\"\"><span class=\"CryptexImg ctx3YshYUldyumN_fGoiNQO2tZw3v4HZAzMf5k_m5j-QWE\"><\/span><\/span><\/p>\n<div class=\"pdfprnt-buttons pdfprnt-buttons-product pdfprnt-bottom-left\"><a href=\"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/product\/11472?print=pdf\" class=\"pdfprnt-button pdfprnt-button-pdf\" target=\"_blank\"><span class=\"pdfprnt-button-title pdfprnt-button-pdf-title\">Descargar ficha<\/span><\/a><\/div>","protected":false},"excerpt":{"rendered":"<p>KeyQ es un sistema que permite obtener los t\u00e9rminos (simples y compuestos, esto es, la terminolog\u00eda del dominio de aplicaci\u00f3n) de un conjunto de documentos. Tambi\u00e9n permite la b\u00fasqueda por dichos t\u00e9rminos, devolviendo los p\u00e1rrafos donde se encuentra dicho t\u00e9rmino compuesto, ordenados por relevancia.<\/p>\n","protected":false},"featured_media":11471,"template":"","meta":{"_acf_changed":false},"product_cat":[2384],"product_tag":[3958,3959,3957,3952,3960],"comunidades-upm":[],"quien":[],"mapa":[{"term_id":126,"name":"Tecnolog\u00edas digitales, Inteligencia Artificial, ciberseguridad, 5G, rob\u00f3tica","slug":"tecnologias_digitales-ai-ciberseguridad-5g-robotica","term_group":0,"term_taxonomy_id":126,"taxonomy":"mapa","description":"","parent":0,"count":194,"filter":"raw","term_order":"23"}],"disponibilidad":[{"term_id":204,"name":"Disponible","slug":"disponible","term_group":0,"term_taxonomy_id":204,"taxonomy":"disponibilidad","description":"","parent":0,"count":110,"filter":"raw","term_order":"0"}],"donde":[{"term_id":1884,"name":"Artificial Intelligence R&amp;I Centre (AI.nnovation Space)","slug":"en_artificial-intelligence-ri-centre-ai-nnovation-space","term_group":0,"term_taxonomy_id":1884,"taxonomy":"donde","description":"","parent":0,"count":41,"filter":"raw","term_order":"0"},{"term_id":664,"name":"Centro de I+D+i en Inteligencia Artificial (AI.nnovation Space)","slug":"centro-de-idi-en-inteligencia-artificial-ai-nnovation-space","term_group":0,"term_taxonomy_id":664,"taxonomy":"donde","description":"","parent":0,"count":44,"filter":"raw","term_order":"0"},{"term_id":526,"name":"Ontology Engineering Group","slug":"ontology-engineering-group","term_group":0,"term_taxonomy_id":526,"taxonomy":"donde","description":"Trabajamos en las siguientes l&iacute;neas:\n&nbsp;\n\n<strong>Ingenier&iacute;a Ontol&oacute;gica.<\/strong> Construimos ontolog&iacute;as en dominios muy diversos, as&iacute; como m&eacute;todos y herramientas para facilitar esta tarea.\n<strong>Web Sem&aacute;ntica y Linked Data<\/strong>. Hemos creado Linked Data para organizaciones como la Biblioteca Nacional de Espa&ntilde;a, Instituto Geogr&aacute;fico Nacional, Ayuntamiento de Zaragoza, etc. Tambi&eacute;n hemos creado un gran n&uacute;mero de aplicaciones basadas en estos datos.\n<strong>Ingenier&iacute;a Ling&uuml;&iacute;stica.<\/strong> Aplicamos t&eacute;cnicas de procesamiento de lenguaje natural para la construcci&oacute;n de ontolog&iacute;as y la anotaci&oacute;n de textos, as&iacute; como el tratamiento de la multilingualidad.\n<strong>Integraci&oacute;n de datos.<\/strong> Creamos herramientas para integrar datos de bases de datos relacionales, hojas de c&aacute;lculo, streams de datos,, etc.\n<strong>e-Ciencia Sem&aacute;ntica.<\/strong> Facilitamos la labor de investigadores de varias disciplinas mediante el uso de tecnolog&iacute;as sem&aacute;nticas.\n","parent":0,"count":45,"filter":"raw","term_order":"0"},{"term_id":1750,"name":"Ontology Engineering Group","slug":"en_ontology-engineering-group","term_group":0,"term_taxonomy_id":1750,"taxonomy":"donde","description":"Trabajamos en las siguientes l&iacute;neas:\n&nbsp;\n\n<strong>Ingenier&iacute;a Ontol&oacute;gica.<\/strong> Construimos ontolog&iacute;as en dominios muy diversos, as&iacute; como m&eacute;todos y herramientas para facilitar esta tarea.\n<strong>Web Sem&aacute;ntica y Linked Data<\/strong>. Hemos creado Linked Data para organizaciones como la Biblioteca Nacional de Espa&ntilde;a, Instituto Geogr&aacute;fico Nacional, Ayuntamiento de Zaragoza, etc. Tambi&eacute;n hemos creado un gran n&uacute;mero de aplicaciones basadas en estos datos.\n<strong>Ingenier&iacute;a Ling&uuml;&iacute;stica.<\/strong> Aplicamos t&eacute;cnicas de procesamiento de lenguaje natural para la construcci&oacute;n de ontolog&iacute;as y la anotaci&oacute;n de textos, as&iacute; como el tratamiento de la multilingualidad.\n<strong>Integraci&oacute;n de datos.<\/strong> Creamos herramientas para integrar datos de bases de datos relacionales, hojas de c&aacute;lculo, streams de datos,, etc.\n<strong>e-Ciencia Sem&aacute;ntica.<\/strong> Facilitamos la labor de investigadores de varias disciplinas mediante el uso de tecnolog&iacute;as sem&aacute;nticas.\n","parent":0,"count":45,"filter":"raw","term_order":"0"}],"infraestructura":[],"ods":[{"term_id":2247,"name":"Industria, Innovaci\u00f3n e Infraestructura","slug":"industria-innovacion-e-infraestructura","term_group":0,"term_taxonomy_id":2247,"taxonomy":"ods","description":"","parent":0,"count":171,"filter":"raw","term_order":"0"}],"origen":[{"term_id":192,"name":"Soluciones tecnol\u00f3gicas","slug":"soluciones-tecnologicas","term_group":0,"term_taxonomy_id":192,"taxonomy":"origen","description":"","parent":0,"count":278,"filter":"raw","term_order":"0"}],"familia_tax":false,"quien_tax":false,"donde_tax":false,"year":"2019-01-01","contacto":"ETSI Inform\u00e1ticos - UPM\r\nOntology Engineering Group (OEG)\r\nDepartamento de Inteligencia Artificial\r\nUniversidad Polit\u00e9cnica de Madrid\r\nCampus de Montegancedo, sn\r\nBoadilla del Monte, 28660 Madrid","telefono":"910672915","pagina_web":"http:\/\/demo.inno.oeg-upm.net\/","email":"mariano.rico@upm.es","id_ficha_portal":"230","video":"","adjuntos":false,"adjuntos_portal":"https:\/\/www.upm.es\/recursosidi\/wp-content\/uploads_kairos\/ficha_230\/ficha_230_doc_16.pdf","inf":false,"departamento":"","acf":[],"lang":"es","translation":{"es":11472,"en":11474},"_links":{"self":[{"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/product\/11472"}],"collection":[{"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/product"}],"about":[{"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/types\/product"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/media\/11471"}],"wp:attachment":[{"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/media?parent=11472"}],"wp:term":[{"taxonomy":"product_cat","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/product_cat?post=11472"},{"taxonomy":"product_tag","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/product_tag?post=11472"},{"taxonomy":"comunidad_upm","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/comunidades-upm?post=11472"},{"taxonomy":"quien","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/quien?post=11472"},{"taxonomy":"mapa","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/mapa?post=11472"},{"taxonomy":"disponibilidad","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/disponibilidad?post=11472"},{"taxonomy":"donde","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/donde?post=11472"},{"taxonomy":"infraestructura","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/infraestructura?post=11472"},{"taxonomy":"ods","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/ods?post=11472"},{"taxonomy":"origen","embeddable":true,"href":"https:\/\/www.upm.es\/recursosidi\/wp-json\/wp\/v2\/origen?post=11472"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}