Ideen für neue Arten der Erschließung gesucht

Tatsächlich scheint sowohl Defragmentierung als auch Strukturerkennung erstaunlich gut zu funktionieren. Die Defragmentierung habe ich sowohl mit ChatGPT May 3 Version als auch mit dem offenen Modell OA_SFT_Llama_30B_6 ausprobiert. Man kann gut überprüfen, ob alle Zeichen der Ausgabe auch in der Eingabe vorkamen - sonst hat der Generator halluziniert.

Hier das Ergebnis einer Strukturerkennung mit *OA_SFT_Llama_30B_6 *:

{
    "Name": "Brabeck Josef",
    "Title": "Oblt.",
    "Unit": "FJB. Nr. 6",
    "Company": "1. Komp.",
    "Location": "Zichowitz",
    "Injury": "Schuß in den linken Ellbogen",
    "Hospital": "Rudolfspital in Wien",
    "RoomNumber": "III."
}

Das ist schon wirklich beeindruckend, zumal ich gar nichts vorgegeben hatte, um welche Art von Informationen es sich handelt.

Wenn man das alles geschickt in einem Arbeitsablauf kombiniert, könnte das die Art, wie wir serielle Quellen aufbereiten, total umkrempeln.

2 Likes