März 2024
Neue Publikationen und Testwerkzeuge
Wenn Sie unsere Vorträge auf der CAA 2023 in Amsterdam verpasst haben oder Ihre eigenen Machine Learning Modelle auf unseren Münzen testen wollen, geht es hier entlang.
Die Publikationen
• Gampe S., Tolle K. (2023, December 22): Creating an additional class layer with machine learning to counter overfitting in an unbalanced ancient coin dataset, https://zenodo.org/records/10424274
• Peter U., Franke C., Köster J., Tolle K., Gampe S., Stolba V.F. (2024, February 8): CORPUS NUMMORUM – A Digital Research Infrastructure for Ancient Coins, https://doi.org/10.5281/zenodo.10633905
wurden von der PCI Archaeology positiv evaluiert und konnten somit im Rahmen der Proceedings der CAA Amsterdam 2023 erscheinen.
In dem Zusammenhang wurde auch eine Dokumentation zum Editor auf Zenodo erstellt.
• Köster J., Franke C. (2024, January 4): Corpus Nummorum Editor, https://doi.org/10.5281/zenodo.10458195
Alle Links sind auch auf unserer Webseite unter der Rubrik Ressourcen zu finden.
Außerdem haben wir im Oktober unser Coin Image Dataset (
https://zenodo.org/records/10033993 ) publiziert. Das sind 115,160 Münzbilder von über 29,000 Münzen. Mit diesem Datenset wurden im CN-Projekt die Machine Learning basierten Bilderkennungsmodelle trainiert. Mit der Publikation des Datensets laden wir alle ein, mit diesem großen Datenset eigene Ideen und Modelle zu testen und umzusetzen.
Die von uns erreichten Ergebnisse der Bilderkennung können ebenfalls mit den Münzen in CN oder mit eigenen Bildern getestet werden. Das Jupyter-Notebook (Google Colab) zur Münztyp- und zur Münzstättenerkennung wurde auf GitHub hochgeladen:
https://github.com/Frankfurt-BigDataLab/IR-on-coin-datasets. Die Links sind auch auf unserer Webseite abgelegt:
https://www.corpus-nummorum.eu/resources/open-source-tools.
Die englische NLP-Pipeline lässt sich direkt bei den Münzbeschreibungen aufrufen. Auch damit können zusätzlich eigene Beschreibungen getestet werden. Es werden sowohl die Subjekte und Objekte (NER), als auch die sie verbindenden Beziehungen (RE) ausgezeichnet:
https://github.com/Frankfurt-BigDataLab/NLP-on-multilingual-coin-datasets.

Autor: Ulrike Peter
Zurück zur Übersicht der news