| Home | Dienstleistungen | 7 Vorteile | 5 Ratschläge | Qualitätssicherung | Unsere Kunden | Sprachen | Arbeitsproben | Vorgehensweise | Preise/Kostenvoranschläge | Zahlungsweise | Jobangebote | Übersetzungsportal | Kontakt |
ENGLISCHER INFORMATIKTEXT, VON DEM AUSGEHEND DIE ÜBERSETZUNG INS SPANISCHE ERFOLGT
FULL TEXT SEARCH.
Because of the volume of documents that a Content Search must handle, some searches are faster than others. To determine the best search method for your particular task, consider these factors:
If you are performing a search for a word that contains a period at the end, such as Mr. or U.S.A., the search engine will assume that the final period is the end of a sentence and will not index it. Enter the words without the final period, as in Mr and U.S.A, to locate them.
Special characters, such as those used as wildcards and precedence expressions, are not indexed, so you cannot search for them. In such a case, you could simply enter your search without the characters. For a phone number, enter the number using spaces instead of parentheses or dashes, as in 781 555 3800.
A common problem is searching for a broad topic. If your Search Results list is too long for you to find the document for which you are looking, you should narrow your search. Include more operators or select Profile fields (Author, Entered by) for a more specific search. A search for a specific document containing the term Alimony is more easily found if you include other terms to narrow the search. For example, Alimony <AND> Caldwell <AND> December returns a more focused list than one of these search operators alone. The PHRASE and NEAR/n proximity operators are more useful in a case where a normal "AND" search might deliver a very large list.
If you are not familiar with the search engine syntax, see the topics below:
Perform a Boolean Search
Types of Syntax in Content Searching
Search Operators
Wildcards in Content Searching
Perform a Boolean Search
Below are a few examples of search criteria that are acceptable in the Boolean Search field of the Content Search tab. The DM Webtop will convert the criteria and send a query to the DM Server.
For additional information on available search operators that can be used in content searching, see Search Operators.
hotel & reservation ◊ searches for: hotel AND reservation
hotel | reservation ◊ searches for: hotel OR reservation
hotel& ^ reservation ◊ searches for: hotel BUT NOT reservation
hotel%reservation ◊ searches for: hotel NEAR reservation
"hotel reservation" ◊searches for: PHRASE containing hotel and reservation
hotel|(reservation & deposit) ◊ searches for: hotel OR BOTH reservation AND deposit
Types of Syntax in Content Searching
Simple Syntax
When using simple syntax with the DM Server Indexer, relevance is strict Boolean with critical terms ordered. This means that terms that occur in fewer documents will have a higher priority, making documents containing these terms have a higher relevance. When documents are relevance-ranked, they are listed in an order based on their importance to your search criteria. Relevance-ranked results are presented with the most relevant documents at the top of the list.
Explicit Syntax
When you enclose individual words in double quotation marks, the Indexer interprets those words literally. For example, by entering the word "generator" in double quotation marks, the words "generate" and "generation" will not be considered in the search. To retrieve documents containing the word "generator" without searching for its stemmed variations, enter the word "generator" using explicit syntax:
"generator"
Precedence Expressions in Content Searching
The language used for composing search statements has a set of rules that determine the precedence for evaluation. An Indexer query expression is processed using explicit precedence rules applying to the operators used. While a query expression is read from left to right, some operators carry more weight than others and this will affect the interpretation of the expression. For example, an AND operator takes precedence over an OR operator.
Precedence Expression
Use
Parentheses ( )
Parentheses indicate the order the directions are to be carried out; information within parentheses is read first, then information outside parentheses is read next.
Prefix and Infix Notation
Words that use any operator, except the operators WILDCARD and WORD, can be defined in prefix notation or infix notation.
Prefix notation is a format specifying that the operator comes before the words to be used with that operator. When prefix notation is used, precedence is explicit within the expression.
Infix notation is a format specifying that the operator is to be specified between each element within the expression. When infix notation is used, precedence is implicit within the expression; for example, the AND operator takes precedence over the OR operator.
If you are using the DM Server Indexer, infix notation should not be combined with prefix notation in the same query.
Commas ,
If an expression includes two or more words within parentheses, as is used in prefix notation, a comma is required as a separator between each element enclosed within the parentheses.
Angle Brackets < >
Left and right angle brackets (< >) are reserved for designating operators and modifiers. They are not required.
Double Quotation Marks " "
To search for a word that is reserved as an operator ("and," "or," and "not"), enclose the word in double quotation marks.
Wildcards in Content Searching
The following wildcards can be used in content searching:
Wildcard
Definition
Example
?
Specifies one alphanumeric character.
?an locates ran, pan, can, and ban
*
Specifies one or more of any alphanumeric characters. You should not use * to specify the first character of a wildcard string.
corp* locates corporate, corporation, corporal, and corpulent.
Search Operators
Operators represent logic to be applied to a search element. This logic defines the qualifications a document must meet to be retrieved.
Operator
Description
WORD
Searches for a word.
AND
Searches for documents containing all of two or more search terms, and provides relevance-ranked results.
OR
Searches for documents containing one of two or more search terms, and provides relevance-ranked results.
NEAR/n
Searches for information containing two or more words within n number of words of each other, where n is an integer.
NOT
Searches for documents based on evidence not found in the documents.
PARAGRAPH
Selects documents that include all of the search elements you specify within the same paragraph.
PHRASE
Searches for information containing two or more words in the same phrase.
SENTENCE
Selects documents that include all of the search elements you specify within the same sentence.
THESAURUS
Expands the search to include the word you enter and its synonyms.
AND Operator
The And operator searches for documents that contain all of the search elements you specify. Documents retrieved using the AND operator are relevance-ranked.
To search for documents that contain the phrase "pharmaceutical companies" and the word "stock":
pharmaceutical companies AND stock
To search for documents that contain both the words "data" and "security":
data AND security
NEAR/n Operator
The NEAR/n operator is a proximity operator used to search for information containing two or more words within n number of words of each other, where n is an integer. The Indexer will assign document scores based on the relative distance of search terms, when the terms are separated by n words or less; words separated by more than n words will not be assigned scores and will not be retrieved. For example, if NEAR/5 is used to find two terms within five words of each other, a document that has the two terms within two words of each other scores higher than a document that has the two terms within five words of each other.
The N variable can be an integer between 1 and 1,024, where NEAR/ 1 searches for terms that are next to each other. If N is 1,000 or above, the N value must be given without a comma.
To search for relevance-ranked documents that contain search terms within N words of each other, the following syntax can be used.
Simple Syntax = wordA <NEAR/N> wordB <NEAR/N> wordC ...
Explicit Syntax = <NEAR/N> (wordA, wordB, wordC, ...)
To search for the term "air" within 10 words of the term "pollution," you can use one of the query expressions below.
Simple Syntax = air <NEAR/10> pollution
Explicit Syntax = <NEAR/10> (air, pollution)
Using the ORDER modifier with NEAR/N allows you to perform ordered searches. To search for the terms "air" and "pollution" within two words of each other, you can use one of the query expressions below.
Simple Syntax = air <ORDER> <NEAR/2> pollution
Explicit Syntax = <ORDER> <NEAR/2> (air, pollution)
NOT Operator
The NOT modifier searches for documents based on evidence not found in the documents. You can use the NOT modifier with a word or phrase to exclude documents that show evidence of that word or phrase. The NOT modifier can be used only with the operators AND and OR.
Simple Syntax
To find only documents that contain the words "cat" and "mouse" but not the word "dog," you can enter the following:
cat, mouse <AND> <NOT> dog
Explicit Syntax
You can ensure documents that contain words that have a different connotation from what you intend are not retrieved. For example, the word "coke" may refer to "Coca-Cola," as well as the interim product created during the coal-producing process. To retrieve documents that refer to "Coca-Cola" and not the coal interim product "coke," you can enter the following:
(coke <AND> <NOT> coal)
OR Operator
The OR operator is a concept operator used to search for documents containing one of two or more search terms, and provides relevance-ranked results.
Simple Syntax
To search for all documents that contain one or more of the words and phrases "election," "national elections," and "senatorial race," you can enter the following:
election OR national elections OR senatorial race
Explicit Syntax
To search for documents that contain either the word "computer" or the word "security," you can enter the following:
<OR> (computer, security)
PARAGRAPH Operator
The PARAGRAPH operator selects documents that include all of the search elements you specify within the same paragraph. Valid search elements are two or more words or phrases. You can specify search elements in a sequential or a random order. Documents are retrieved as long as search elements appear in the same paragraph.
To retrieve relevance-ranked documents that contain stemmed variations of the word "drug" and the phrase "cancer treating" in the same paragraph, you can enter the following:
drug <PARAGRAPH> cancer treating
To search for three or more words or phrases, you must use the PARAGRAPH operator between each word or phrase.
PHRASE Operator
The PHRASE operator is a proximity operator used to search for information containing two or more words in the same phrase. A phrase is a grouping of two or more words that occur in a specific order. Following are examples of search syntax.
Simple Syntax
By default, two or more words separated by a space are considered to be a phrase in simple syntax. To search for relevance-ranked documents that contain the phrase "mission oak," you can enter either of the following:
mission oak
mission &lt;AND> oak
Explicit Syntax
To search for documents containing the phrase "black and white," you can enter the following:
"black white"
Note: With the current search engine, you do not need to use the <PHRASE> operator in your search for a phrase - it is implicit.
SENTENCE Operator
The SENTENCE operator selects documents that include all of the search elements you specify within the same sentence. You can specify search elements in a sequential or random order. Documents are retrieved as long as search elements appear in the same sentence.
To retrieve relevance-ranked documents that contain stemmed variations of the words "American," and "innovation" within the same sentence, you can enter the following:
american <SENTENCE> innovation
<SENTENCE> (american, innovation)
THESAURUS Operator
The THESAURUS operator selects documents that contain one or more synonyms of the word you specify. For example, to retrieve documents containing synonyms of the word "altitude," you can enter the following:
<THESAURUS> altitude
The documents retrieved will include words such as "height" or "elevation."
WORD Operator
The WORD operator is an evidence operator used to search for a word without stemming.
For example, to search for documents that contain the word "rhetoric," you can enter the following:
<WORD> rhetoric
ÜBERSETZUNG DES INFORMATIKTEXTES INS SPANISCHE
BÚSQUEDA POR CONTENIDO.
Las búsquedas por contenido gestionan grandes volúmenes de documentos, por lo que algunas son más rápidas que otras. Para saber cuál es el mejor método de búsqueda para una tarea concreta, tenga en cuenta lo siguiente:
Si busca una palabra que va seguida de un punto al final, como Mr. o U.S.A., el motor de búsqueda interpretará ese punto como final de una frase y no lo indexará. Introduzca las palabras sin el punto final, por ejemplo Mr o U.S.A, y haga la búsqueda.
Si la palabra contiene caracteres especiales, por ejemplo los que se utilizan como comodines y símbolos prioridad, no se indexarán, por lo que la búsqueda no los incluirá. Simplemente, introduzca su petición de búsqueda prescindiendo de dichos caracteres. En el caso de números de teléfono, introdúzcalos utilizando espacios en lugar de paréntesis o guiones; por ejemplo, 0034 93 3334455.
Un problema común es buscar temas excesivamente amplios. Si la lista de resultados que obtiene es demasiado larga, debería afinar la búsqueda. Para ello, puede incluir más operadores, o seleccionar campos de perfil (Autor, Introducido por). Un documento que contiene la palabra Antonia se encontrará más fácilmente si se incluyen otros términos que hagan la búsqueda más precisa. Por ejemplo, Antonia <AND> Martínez <AND> Diciembre dará como resultado una lista más concreta que si hacemos la búsqueda usando sólo uno de los operadores. Cuando una búsqueda normal, utilizando simplemente el operador "AND", dé como resultado una lista excesivamente larga, resulta más útil utilizar los operadores de proximidad PHRASE y NEAR/n.
Si no está familiarizado con la sintaxis que utilizan los motores de búsqueda, le recomendamos que lea los apartados que figuran a continuación:
Búsqueda booleana
A continuación se incluyen algunos ejemplos de criterios de búsqueda aceptables en el campo “Búsqueda booleana” de la casilla “Búsqueda por contenido”. DM Webtop convertirá los criterios y enviará una petición de búsqueda al Servidor DM.
Para más información sobre los operadores que se pueden utilizar en las búsquedas por contenido, véase Operadores de búsqueda.
hotel & reserva ◊ busca por “hotel” Y “reserva” hotel | reserva ◊ busca por “hotel” O “reserva” hotel& ^ reserva ◊ busca por “hotel” PERO NO “reserva” hotel%reserva ◊ busca por “hotel” CERCA DE “reserva” "reserva de hotel" ◊busca por FRASE que contenga “reserva de hotel” hotel|(reserva & depósito) ◊ busca por “hotel” O (“reservas” Y “depósito”)
Tipos de sintaxis en las búsquedas por contenido
Sintaxis simple
Si utiliza sintaxis simple en el DM Server Indexer, la relevancia es estrictamente booleana, con los términos críticos ordenados. Esto significa que los términos que aparezcan en menos documentos tendrán una mayor prioridad, haciendo que tales documentos tengan una mayor relevancia. La ordenación de los documentos por relevancia los coloca en una lista ordenados por su grado de importancia respecto a los criterios de búsqueda. Los resultados por orden de relevancia se presentan con los documentos de mayor relevancia al inicio de la lista.
Sintaxis explícita
Al incluir palabras sueltas entre comillas dobles, el Indexer las interpretará literalmente. Por ejemplo, si se introduce la palabra "generador" entre comillas, las palabras "generar" y "generación" no entrarán en la búsqueda. Así pues, para encontrar documentos que contengan la palabra "generador", sin buscar sus derivados, introduzca la palabra "generador" utilizando sintaxis explícita:
"generador"
Símbolos de precedencia en las búsquedas por contenido
El idioma que se utiliza para las frases de búsqueda presenta una serie de reglas que determinarán el orden de precedencia. El Indexer procesará las expresiones de búsqueda aplicando a los operadores utilizados esas reglas de precedencia. Al leer una expresión de búsqueda, de izquierda a derecha, dará preferencia a unos frente a otros, lo que afectará a la interpretación de la expresión. Por ejemplo, un operador AND tiene preferencia sobre un operador OR.
Símbolos de precedencia
Comodines en búsquedas por contenido
En las búsquedas por contenido se pueden utilizarse los siguientes comodines:
Especifica un carácter alfanumérico.
?an localizará pan, can, dan y van, por ejemplo.
*
Especifica uno o varios caracteres alfanuméricos. No debe utilizarse como primer carácter de una cadena comodín.
corp* localizará, corporativo, corporación, corporal y corpulento, por ejemplo.
Operadores de búsqueda
Los operadores concretan qué lógica se aplica a un elemento de búsqueda, la cual define qué propiedades ha de cumplir un documento para ser seleccionado.
Operador AND
El operador AND sirve para buscar documentos que contengan todos los elementos de búsqueda que haya indicado. Los documentos devueltos utilizando el operador AND se presentan ordenados por grado de relevancia.
Para buscar documentos que contengan, a la vez, la frase "empresas farmacéuticas" y la palabra "acciones":
empresas farmacéuticas AND acciones
Para buscar documentos que contengan, a la vez, las palabras "datos" y "seguridad":
datos AND seguridad.
Operador NEAR/n
NEAR/n es un operador de proximidad que se utiliza para buscar información que contenga dos o más palabras separadas entre ellas por un número máximo de n palabras, siendo n un número entero. El Indexer asignará a cada documento una puntuación basándose en la distancia relativa entre los términos usados para la búsqueda, siempre que estén separados como máximo por n palabras; los términos separados por más de n palabras no serán identificados como aciertos y no aparecerán entre los resultados. Por ejemplo, si utilizamos NEAR/5 para encontrar dos términos separados por un máximo de cinco palabras, un documento que contenga los dos términos separados por dos palabras puntuará más que un documento en el que los dos términos estén separados por cinco palabras.
La variable N puede ser un número entero entre 1 y 1.024, siendo NEAR/ 1 la expresión de búsqueda de términos que están juntos. Si N es 1.000 o superior, el valor N debe indicarse sin el separador de millares.
Para buscar documentos ordenados por relevancia que contengan términos de búsqueda separados por un máximo de N palabras, puede utilizar las siguientes sintaxis.
Sintaxis simple = palabra A <NEAR/N> palabra B <NEAR/N> palabra C ...
Sintaxis explícita = <NEAR/N> (palabra A, palabra B, palabra C...)
Para buscar el término "aire" con una separación máxima de 10 palabras del término "contaminación", puede utilizar una de las expresiones de búsqueda siguientes:
Sintaxis simple = aire <NEAR/10> contaminación
Sintaxis explícita = <NEAR/10> (aire, contaminación)
Utilizando el modificador ORDER con el operador NEAR/N, se pueden llevar a cabo búsquedas ordenadas. Para buscar por los términos "aire" y "contaminación" con una separación máxima de dos palabras entre ellos, puede utilizar una de las expresiones de búsqueda siguientes.
Sintaxis simple = aire <ORDER> <NEAR/2> contaminación.
Sintaxis explícita = <ORDER> <NEAR/2> (aire, contaminación).
Operador NOT
El modificador NOT lleva a cabo una búsqueda de documentos basándose en la no aparición de determinados términos en los mismos. Puede utilizar el modificador NOT con una palabra o frase para excluir los documentos en los que aparezca dicha palabra o frase. El modificador NOT únicamente se puede utilizar con los operadores AND y OR.
Sintaxis simple.
Para encontrar únicamente los documentos que contengan las palabras "gato" y "ratón" pero no la palabra "perro", puede introducir:
gato, ratón <AND> <NOT> perro.
Sintaxis explícita.
Puede hacer que la búsqueda excluya los documentos que contengan palabras con un significado distinto del que le interesa. Por ejemplo, la palabra "coca" puede referirse tanto a "Coca-Cola" como a la droga obtenida del árbol o planta del mismo nombre. Para realizar una búsqueda referida a la droga, sin obtener resultados referidos a la bebida carbónica, puede introducir:
(coca <AND> <NOT> cola)
Operador OR
OR es un operador conceptual que se utiliza para buscar documentos que contienen dos o más términos de búsqueda, presentando los resultados ordenados según el grado de relevancia.
Sintaxis simple.
Para buscar, por ejemplo, todos los documentos que contengan una o varias de las palabras y frases "elección", "elecciones nacionales" y "carrera al Senado", puede introducir:
elección OR elecciones nacionales OR carrera al Senado
Sintaxis explícita
Para buscar documentos que contengan o bien la palabra "informática" o bien la palabra "seguridad," puede introducir:
<OR> (informática, seguridad)
Operador PARAGRAPH
El operador PARAGRAPH selecciona los documentos que incluyen, dentro de un mismo párrafo, todos los elementos de búsqueda que se hayan indicado. Son elementos válidos de búsqueda dos o más palabras o frases. Puede indicar los elementos de búsqueda de modo secuencial o en orden aleatorio. La búsqueda encontrará todos los documentos en los que los elementos aparezcan en un mismo párrafo.
Para encontrar documentos ordenados por relevancia que contengan variaciones derivadas de la palabra "fármaco" y de la frase "tratamiento del cáncer" en el mismo párrafo, puede introducir:
fármaco <PARAGRAPH> tratamiento del cáncer
Para buscar tres o más palabras o frases, debe utilizar el operador PARAGRAPH entre cada una de las palabras o frases.
Operador PHRASE
PHRASE es un operador de proximidad utilizado para buscar información que contenga dos o más palabras en una misma frase. Una frase es una agrupación de dos o más palabras que se presenta en un orden determinado. A continuación se indican algunos ejemplos de la sintaxis de búsqueda.
Sintaxis simple
Por defecto, dos o más palabras separadas por un espacio se consideran una frase escrita en sintaxis simple. Para buscar documentos ordenados por relevancia que contengan la frase "roble macizo", puede introducir una de las expresiones siguientes:
Para buscar documentos que contengan la frase "blanco y negro", puede introducir:
"blanco negro"
Nota: Con el motor de búsqueda actual, no necesita utilizar el operador <PHRASE> al buscar una frase: está implícito.
Operador SENTENCE
El operador SENTENCE selecciona los documentos que incluyen, en una misma oración, todos los elementos de búsqueda introducidos. Puede indicar elementos de búsqueda en orden secuencial o aleatorio. La búsqueda encontrará todos los documentos donde los elementos aparecen en una misma oración.
Para que la búsqueda devuelva documentos ordenados por relevancia que contengan variaciones de las palabras "americana" e "innovación" en la misma oración, puede introducir:
Operador THESAURUS
El operador THESAURUS selecciona los documentos que contienen uno o varios sinónimos de la palabra que haya indicado. Por ejemplo, para obtener los documentos que contengan sinónimos de la palabra "altitud", puede introducir:
Operador WORD
El operador WORD se utiliza para buscar una palabra sin sus derivados.
Por ejemplo, para buscar los documentos que contengan la palabra "retórica", puede introducir: