001     300544
005     20240928181118.0
024 7 _ |a G:(GEPRIS)393215159
|d 393215159
035 _ _ |a G:(GEPRIS)393215159
040 _ _ |a GEPRIS
|c http://gepris.its.kfa-juelich.de
150 _ _ |a Automatische Nachkorrektur historischer OCR-erfasster Drucke mit integrierter optionaler interaktiver Korrektur
|y 2018 - 2020
371 _ _ |a Professor Dr. Klaus U. Schulz
450 _ _ |a DFG project G:(GEPRIS)393215159
|w d
|y 2018 - 2020
510 1 _ |a Deutsche Forschungsgemeinschaft
|0 I:(DE-588b)2007744-0
|b DFG
680 _ _ |a Bei der Volltextdigitalisierung historischer Drucke mittels OCR besteht nach wie vor ein signifikanter Verbesserungsbedarf, der den allgemeinen Hintergrund der DFG-Ausschreibung ,,Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke`` darstellt. In Modul 3 der Ausschreibung wird speziell die Notwendigkeit eines Systems zur Nachkorrektur OCR-erfasster historischer Texte begründet. In unserer Arbeitsgruppe wurde über mehrere Jahre hinweg ein sehr leistungsfähiges System ,,PoCoTo'' zur interaktiven Nachkorrektur OCR-erfasster historischer Drucke entwickelt. Für die Massendigitalisierung sollten jedoch aus offenkundigen Gründen zunächst alle Möglichkeiten einer vollautomatischen Korrektur ausgeschöpft werden. Das Hauptproblem bei der automatischen Korrektur besteht darin zu vermeiden, dass nicht im Korrekturlexikon erfasste, aber korrekte OCR-Tokens durch vermeintliche Korrekturen ersetzt werden. Zielsetzung des Antrags ist es, von PoCoTo ausgehend ein leistungsfähiges System zur vollautomatischen Korrektur zu entwickeln, das derartige ,,Verschlimmbesserungen`` weitestgehend vermeidet. Hierzu wird die vorhandene Technologie substantiell erweitert. Da man nicht erwarten kann, dass mit einer vollautomatischen Nachkorrektur immer die erforderlichen extrem hohen Qualitätsstandards erreicht werden, soll die vollautomatische Korrektur auch als Vorstufe einer optional nachgeschalteten semi-automatischen oder interaktiven Nachkorrektur nutzbar sein. Verfahren zur semi-automatischen oder interaktiven Nachkorrektur, die die während der automatischen Korrekturphase gewonnenen Daten und Einsichten ausnützen, sollen direkt im System integriert sein.
909 C O |o oai:juser.fz-juelich.de:967287
|p authority:GRANT
|p authority
909 C O |o oai:juser.fz-juelich.de:967287
980 _ _ |a G
980 _ _ |a AUTHORITY


LibraryCollectionCLSMajorCLSMinorLanguageAuthor
Marc 21