-
Deaves, J.C.; Pache, J.E.: Chemical and numerical indexing for the INSPEC database (1989)
0.04
0.036347877 = product of:
0.14539151 = sum of:
0.14539151 = weight(_text_:held in 2288) [ClassicSimilarity], result of:
0.14539151 = score(doc=2288,freq=2.0), product of:
0.35627222 = queryWeight, product of:
5.2765985 = idf(docFreq=616, maxDocs=44421)
0.0675193 = queryNorm
0.40809107 = fieldWeight in 2288, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.2765985 = idf(docFreq=616, maxDocs=44421)
0.0546875 = fieldNorm(doc=2288)
0.25 = coord(1/4)
- Abstract
- The wealth of chemical information on the INSPEC database is easily retrieved using the printed subject indexes to the associated abstract journals. However, this subject indexing is insufficient for machine retrieval, and free-text searching has special difficulties. An easy-to-use retrieval system has been developed which overcomes many problems, especially the retrieval of non-stoichiometric compositions, which are a feature solid-state chemistry. The scheme is limited to inorganic material, but allows flexibility and identification of dopants, interfaces and surfaces or substrates. At the same time, a system has been introduced for the online retrieval of numerical data included in the data base. This has successfully standardized the way in which such data is held for searching, enabling further refinement of searches where numerical information is significant
-
Tseng, Y.-H.: Keyword extraction techniques and relevance feedback (1997)
0.04
0.036347877 = product of:
0.14539151 = sum of:
0.14539151 = weight(_text_:held in 2830) [ClassicSimilarity], result of:
0.14539151 = score(doc=2830,freq=2.0), product of:
0.35627222 = queryWeight, product of:
5.2765985 = idf(docFreq=616, maxDocs=44421)
0.0675193 = queryNorm
0.40809107 = fieldWeight in 2830, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.2765985 = idf(docFreq=616, maxDocs=44421)
0.0546875 = fieldNorm(doc=2830)
0.25 = coord(1/4)
- Abstract
- Automatic keyword extraction is an important and fundamental technology in an advanced information retrieval systems. Briefly compares several major keyword extraction methods, lists their advantages and disadvantages, and reports recent research progress in Taiwan. Also describes the application of a keyword extraction algorithm in an information retrieval system for relevance feedback. Preliminary analysis shows that the error rate of extracting relevant keywords is 18%, and that the precision rate is over 50%. The main disadvantage of this approach is that the extraction results depend on the retrieval results, which in turn depend on the data held by the database. Apart from collecting more data, this problem can be alleviated by the application of a thesaurus constructed by the same keyword extraction algorithm
-
Ladewig, C.; Rieger, M.: Ähnlichkeitsmessung mit und ohne aspektische Indexierung (1998)
0.02
0.016410867 = product of:
0.06564347 = sum of:
0.06564347 = weight(_text_:und in 3526) [ClassicSimilarity], result of:
0.06564347 = score(doc=3526,freq=10.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.4383508 = fieldWeight in 3526, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=3526)
0.25 = coord(1/4)
- Abstract
- Für eine fiktive Dokumentmenge wird eine Dokument-Wort-Matrix erstellt und mittels zweier Suchanfragen, ebenfalls als Matrix dargestellt, die Retrievalergebnisse ermittelt. Den Wörtern der Dokumentmenge werden in einem zweiten Schritt Aspekte zugeordnet und die Untersuchung erneut durchgeführt. Ein Vergleich bestätigt die schon früher gefundenen Vorteile des aspektischen Indexierung gegenüber anderen Methoden der Retrievalverbesserung, wie Trunkierung und Controlled Terms
- Source
- nfd Information - Wissenschaft und Praxis. 49(1998) H.8, S.459-462
-
Gretz, M.; Thomas, M.: Indexierungen in biomedizinischen Literaturdatenbanken : eine vergleichende Analyse (1991)
0.01
0.014359509 = product of:
0.057438035 = sum of:
0.057438035 = weight(_text_:und in 5103) [ClassicSimilarity], result of:
0.057438035 = score(doc=5103,freq=10.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.38355696 = fieldWeight in 5103, product of:
3.1622777 = tf(freq=10.0), with freq of:
10.0 = termFreq=10.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0546875 = fieldNorm(doc=5103)
0.25 = coord(1/4)
- Abstract
- Auf der Grundlage von vier Originaldokumenten, d.h. dokumentarischen Bezugseinheiten (DBEs), wird die Indexierung in vier biomedizinischen Online-Datenbanken (MEDLINE, EMBASE, BIOSIS PREVIEWS, SCISEARCH) analysiert. Anhand von Beispielen werden inahltliche Erschließung, Indexierungstiefe, Indexierungsbreite, Indexierungskonsistenz, Präzision (durch syntaktisches Indexieren, Gewichtung, Proximity Operatoren) und Wiederauffindbarkeit (Recall) der in den Datenbanken gespeicherten Dokumentationseinheien (DBEs) untersucht. Die zeitaufwendigere intellektuelle Indexierung bei MEDLINE und EMBASE erweist sich als wesentlich präziser als die schneller verfügbare maschinelle Zuteilung von Deskriptoren in BIOSIS PREVIEWS und SCISEARCH. In Teil 1 der Untersuchung werden die Indexierungen in MEDLINE und EMBASE, in Teil 2 die Deskriptorenzuteilungen in BIOSIS PREVIEWS und SCISEARCH verglichen
-
Chen, X.: Indexing consistency between online catalogues (2008)
0.01
0.011235752 = product of:
0.04494301 = sum of:
0.04494301 = weight(_text_:und in 3209) [ClassicSimilarity], result of:
0.04494301 = score(doc=3209,freq=12.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.30011827 = fieldWeight in 3209, product of:
3.4641016 = tf(freq=12.0), with freq of:
12.0 = termFreq=12.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0390625 = fieldNorm(doc=3209)
0.25 = coord(1/4)
- Abstract
- In der globalen Online-Umgebung stellen viele bibliographische Dienstleistungen integrierten Zugang zu unterschiedlichen internetbasierten OPACs zur Verfügung. In solch einer Umgebung erwarten Benutzer mehr Übereinstimmungen innerhalb und zwischen den Systemen zu sehen. Zweck dieser Studie ist, die Indexierungskonsistenz zwischen Systemen zu untersuchen. Währenddessen werden einige Faktoren, die die Indexierungskonsistenz beeinflussen können, untersucht. Wichtigstes Ziel dieser Studie ist, die Gründe für die Inkonsistenzen herauszufinden, damit sinnvolle Vorschläge gemacht werden können, um die Indexierungskonsistenz zu verbessern. Eine Auswahl von 3307 Monographien wurde aus zwei chinesischen bibliographischen Katalogen gewählt. Nach Hooper's Formel war die durchschnittliche Indexierungskonsistenz für Indexterme 64,2% und für Klassennummern 61,6%. Nach Rolling's Formel war sie für Indexterme 70,7% und für Klassennummern 63,4%. Mehrere Faktoren, die die Indexierungskonsistenz beeinflussen, wurden untersucht: (1) Indexierungsbereite; (2) Indexierungsspezifizität; (3) Länge der Monographien; (4) Kategorie der Indexierungssprache; (5) Sachgebiet der Monographien; (6) Entwicklung von Disziplinen; (7) Struktur des Thesaurus oder der Klassifikation; (8) Erscheinungsjahr. Gründe für die Inkonsistenzen wurden ebenfalls analysiert. Die Analyse ergab: (1) den Indexieren mangelt es an Fachwissen, Vertrautheit mit den Indexierungssprachen und den Indexierungsregeln, so dass viele Inkonsistenzen verursacht wurden; (2) der Mangel an vereinheitlichten oder präzisen Regeln brachte ebenfalls Inkonsistenzen hervor; (3) verzögerte Überarbeitungen der Indexierungssprachen, Mangel an terminologischer Kontrolle, zu wenige Erläuterungen und "siehe auch" Referenzen, sowie die hohe semantische Freiheit bei der Auswahl von Deskriptoren oder Klassen, verursachten Inkonsistenzen.
- Imprint
- Berlin : Humboldt-Universität / Institut für Bibliotheks- und Informationswissenschaft
-
Tinker, F.F.: Imprecision in meaning measured by inconsistency of indexing (1966-68)
0.01
0.009173953 = product of:
0.036695812 = sum of:
0.036695812 = weight(_text_:und in 2274) [ClassicSimilarity], result of:
0.036695812 = score(doc=2274,freq=2.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.24504554 = fieldWeight in 2274, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.078125 = fieldNorm(doc=2274)
0.25 = coord(1/4)
- Content
- Ergebnisse: (1) Wenn SW frei gewählt, Recherche um so schwieriger, je mehr SW; (2) 'ältere' SW häufiger und weniger genau verwendet als 'jüngere'; (3) viele Wörter mit ungenauer Bedeutung
-
Chan, L.M.: Inter-indexer consistency in subject cataloging (1989)
0.01
0.0073391623 = product of:
0.02935665 = sum of:
0.02935665 = weight(_text_:und in 2275) [ClassicSimilarity], result of:
0.02935665 = score(doc=2275,freq=2.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.19603643 = fieldWeight in 2275, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0625 = fieldNorm(doc=2275)
0.25 = coord(1/4)
- Content
- Die Studie enthält Konsistenzzahlen bezogen auf die LCSH. Diese Zahlen sind kategorienbezogen und können teilweise auf die RSWK übertragen werden
-
Bellamy, L.M.; Bickham, L.: Thesaurus development for subject cataloging (1989)
0.01
0.0055043716 = product of:
0.022017486 = sum of:
0.022017486 = weight(_text_:und in 2261) [ClassicSimilarity], result of:
0.022017486 = score(doc=2261,freq=2.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.14702731 = fieldWeight in 2261, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=2261)
0.25 = coord(1/4)
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Harter, S.P.; Cheng, Y.-R.: Colinked descriptors : improving vocabulary selection for end-user searching (1996)
0.01
0.0055043716 = product of:
0.022017486 = sum of:
0.022017486 = weight(_text_:und in 4284) [ClassicSimilarity], result of:
0.022017486 = score(doc=4284,freq=2.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.14702731 = fieldWeight in 4284, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=4284)
0.25 = coord(1/4)
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus
-
Kedar, R.; Shoham, S.: ¬The subject cataloging of monographs with the use of a thesaurus (2003)
0.01
0.0055043716 = product of:
0.022017486 = sum of:
0.022017486 = weight(_text_:und in 3700) [ClassicSimilarity], result of:
0.022017486 = score(doc=3700,freq=2.0), product of:
0.149751 = queryWeight, product of:
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.0675193 = queryNorm
0.14702731 = fieldWeight in 3700, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
2.217899 = idf(docFreq=13141, maxDocs=44421)
0.046875 = fieldNorm(doc=3700)
0.25 = coord(1/4)
- Theme
- Konzeption und Anwendung des Prinzips Thesaurus