BibTeX und RIS-Export: Inhalt beginnt mit einem nicht sichtbaren Zeichen

Beate R. hinzugefügt 20 Monaten her
beantwortet

Liebes Citavi-Team,

beim Erstellen von Exportdateien im BibTex- oder RIS-Format ist uns aufgefallen, dass an den Beginn ein nicht sichtbares Zeichen \357\273\277 bzw. 0xFEFF geschrieben wird.


Dies führt dazu, dass in einem anderes System (DSpace-Repositorium) der Import scheitert. Ist dieses Zeichen von Citavi aus notwendig? Bei einem Export z.B. aus Zotero wird dies Zeichen nicht gesetzt.


Viele Grüße

Beate R.

Läßt sich dies ändern?

Beste Antwort
Foto

Liebe Beate,

die von Ihnen genenannte Sequenz kann ich in der Datei nicht erkennen. Sie beginnt, wie für UTF-8-kodierte Dateien üblich, mit dem Byte Order Mark EF BB BF:

bea9c26851670900c8c9eaca203ec137

Die sollte aber für keine moderne Anwendung ein Problem darstellen, notwendig ist es für UTF-8 (im Gegensatz zu UTF-16 oder UTF-32) aber nicht unbedingt.

Ist es möglich, dass Ihre andere Anwendung mit UTF-8-kodierten Daten nicht korrekt umgeht? Gelingt der Import, wenn Sie in der Datei die ersten drei Bytes entfernen?

Viele Grüße

Sebastian

Antworten (2)

Foto
2

Liebe Beate

Danke für Ihre Nachricht.

Könnten Sie uns bitte eine der Exportdateien, in der Sie das Phänomen beobachtet haben, zur Prüfung schicken?

Zum Übermitteln der Datei verwenden Sie bitte unsere geschützte Upload-Möglichkeit:

http://www.citavi.com/transfer

Bitte verwenden Sie dieselbe Mail-Adresse wie für die ursprüngliche Anfrage an uns und geben Sie in das Feld "Nachricht" des Upload-Formulars die Ticket-ID dieser Support-Anfrage ein: # 172047 . Wir sichern Ihnen zu, dass die Datei nicht in fremde Hände gerät.

Viele Grüße

Jana

Foto
1

Ist erledigt :-)

Foto
Foto
2

Liebe Beate,

die von Ihnen genenannte Sequenz kann ich in der Datei nicht erkennen. Sie beginnt, wie für UTF-8-kodierte Dateien üblich, mit dem Byte Order Mark EF BB BF:

bea9c26851670900c8c9eaca203ec137

Die sollte aber für keine moderne Anwendung ein Problem darstellen, notwendig ist es für UTF-8 (im Gegensatz zu UTF-16 oder UTF-32) aber nicht unbedingt.

Ist es möglich, dass Ihre andere Anwendung mit UTF-8-kodierten Daten nicht korrekt umgeht? Gelingt der Import, wenn Sie in der Datei die ersten drei Bytes entfernen?

Viele Grüße

Sebastian

Foto
1

Lieber Sebastian,

Danke für die Antwort. Vielleicht sind noch nicht alle Anwendungen modern genug ;-)


BOM use is optional. Its presence interferes with the use of UTF-8 by software that does not expect non-ASCII bytes at the start of a file but that could otherwise handle the text stream.


https://en.wikipedia.org/wiki/Byte_order_mark

Wir werden mal schauen, ob wir DSpace zu einem anderen Umgang mit dem BOM bewegen können.


Viele Grüße

Beate

Foto
1

Hallo, Beate,

falls Sie eine aktuelle Powershell zur Hand haben, lässt sich das BOM mit einem Einzeiler entfernen:


Get-Content ./Citavi.bib | Out-File -Encoding UTF8NoBOM ./Citavinobom.bib
Viele Grüße

Sebastian

Foto
1

Danke für den Hinweis. Wir werden aber eher eine generelle Lösung für verschiedenste Anwender:innen brauchen. :-)

Foto
Antwort schreiben
 
Dateianlage anfügen (KEINE vertraulichen Dokumente!)