<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.loc.gov/MARC21/slim">
<record>
  <controlfield tag="001">300544</controlfield>
  <controlfield tag="005">20240928181118.0</controlfield>
  <datafield tag="035" ind1=" " ind2=" ">
    <subfield code="a">G:(GEPRIS)393215159</subfield>
  </datafield>
  <datafield tag="024" ind1="7" ind2=" ">
    <subfield code="a">G:(GEPRIS)393215159</subfield>
    <subfield code="d">393215159</subfield>
  </datafield>
  <datafield tag="040" ind1=" " ind2=" ">
    <subfield code="a">GEPRIS</subfield>
    <subfield code="c">http://gepris.its.kfa-juelich.de</subfield>
  </datafield>
  <datafield tag="150" ind1=" " ind2=" ">
    <subfield code="a">Automatische Nachkorrektur historischer OCR-erfasster Drucke mit integrierter optionaler interaktiver Korrektur</subfield>
    <subfield code="y">2018 - 2020</subfield>
  </datafield>
  <datafield tag="371" ind1=" " ind2=" ">
    <subfield code="a">Professor Dr. Klaus U. Schulz</subfield>
  </datafield>
  <datafield tag="450" ind1=" " ind2=" ">
    <subfield code="a">DFG project G:(GEPRIS)393215159</subfield>
    <subfield code="w">d</subfield>
    <subfield code="y">2018 - 2020</subfield>
  </datafield>
  <datafield tag="510" ind1="1" ind2=" ">
    <subfield code="a">Deutsche Forschungsgemeinschaft</subfield>
    <subfield code="0">I:(DE-588b)2007744-0</subfield>
    <subfield code="b">DFG</subfield>
  </datafield>
  <datafield tag="680" ind1=" " ind2=" ">
    <subfield code="a">Bei der Volltextdigitalisierung historischer Drucke mittels OCR besteht nach wie vor ein signifikanter Verbesserungsbedarf, der den allgemeinen Hintergrund der DFG-Ausschreibung ,,Skalierbare Verfahren der Text- und Strukturerkennung für die Volltextdigitalisierung historischer Drucke`` darstellt. In Modul 3 der Ausschreibung wird speziell die Notwendigkeit eines Systems zur Nachkorrektur OCR-erfasster historischer Texte begründet. In unserer Arbeitsgruppe wurde über mehrere Jahre hinweg ein sehr leistungsfähiges System ,,PoCoTo'' zur interaktiven Nachkorrektur OCR-erfasster historischer Drucke entwickelt. Für die Massendigitalisierung sollten jedoch aus offenkundigen Gründen zunächst alle Möglichkeiten einer vollautomatischen Korrektur ausgeschöpft werden. Das Hauptproblem bei der automatischen Korrektur besteht darin zu vermeiden, dass nicht im Korrekturlexikon erfasste, aber korrekte OCR-Tokens durch vermeintliche Korrekturen ersetzt werden. Zielsetzung des Antrags ist es, von PoCoTo ausgehend ein leistungsfähiges System zur vollautomatischen Korrektur zu entwickeln, das derartige ,,Verschlimmbesserungen`` weitestgehend vermeidet. Hierzu wird die vorhandene Technologie substantiell erweitert. Da man nicht erwarten kann, dass mit einer vollautomatischen Nachkorrektur immer die erforderlichen extrem hohen Qualitätsstandards erreicht werden, soll die vollautomatische Korrektur auch als Vorstufe einer optional nachgeschalteten semi-automatischen oder interaktiven Nachkorrektur nutzbar sein. Verfahren zur semi-automatischen oder interaktiven Nachkorrektur, die die während der automatischen Korrekturphase gewonnenen Daten und Einsichten ausnützen, sollen direkt im System integriert sein.</subfield>
  </datafield>
  <datafield tag="909" ind1="C" ind2="O">
    <subfield code="o">oai:juser.fz-juelich.de:967287</subfield>
    <subfield code="p">authority:GRANT</subfield>
    <subfield code="p">authority</subfield>
  </datafield>
  <datafield tag="980" ind1=" " ind2=" ">
    <subfield code="a">G</subfield>
  </datafield>
  <datafield tag="980" ind1=" " ind2=" ">
    <subfield code="a">AUTHORITY</subfield>
  </datafield>
  <datafield tag="909" ind1="C" ind2="O">
    <subfield code="o">oai:juser.fz-juelich.de:967287</subfield>
  </datafield>
</record>
</collection>