Privacy

Stefan K. hinzugefügt 9 Monaten her
beantwortet

When importing PDF files (link to the manual), there seems to be some automation running in the background that 1.) scans the PDF for certain signatures and 2.) having found these, looks for this metatdata online -> by "using the DOI name or other ID, as long as one is present in the first five pages of the PDF".

  1. Is there a way to block 2.)?
  2. And if so: can we be certain that the process doing 1.) is done locally, and not in some way uploading the e.g. "first five pages of the PDF" to some dedicated online server, to ease the task?

Simple use case: I may want to use Citavi to archive my confidential grant applications (as a PDF or other document type) AND do not want any information leaving my local file system / firewalled network (explicitly no cloud groups here) to the WWW - unless I tell Citavi to do so. This is clearly a somewhat paranoid use case - but things become more realistically problematic if, say, there are PDF's with patient data in them...

Cheers - Stefan

PS: Would the answers apply to all versions of Citavi?

Beste Antwort
Foto

Danke für die detaillierte Schilderung!

Dann dürfte ich zusammenfassen, dass ein vom Benutzer definiertes bzw. kontrolliertes Vorgehen über was, wann bzw. ob hochgeladen wird - wenn eine PDF importiert wird - nicht möglich ist? Ist klar gut für die Usability, aber nicht so gut für Datenprivacy/-hoheit. Ein kleiner Button "Wollen Sie oder wollen Sie nicht?" wäre diesbzgl. nett...

Klar - im einem PDF mit z.B. Patientenbezug (z.B. Fallinterviews prä qualitativer Auswertung -> mir ist klar, dass Citavi kein klassisches DMS ist und auch nicht MAXQDA, und eine solche Nutzung ggf. den Rahmen sprengt, wenn auch Citavi für genau ein solches Ziel bzgl. seiner Funktionalität hervorragende geeignet wäre) findet sich i.d.R. keine DOI/ISBN/PubMed-ID/ArXiv-ID, aber eben doch vielleicht "[eine] grösste Überschrift" mit Patientenbezug. Diese würde hochgeladen und das wäre theoretisch problematisch.

Mit den Metadaten -> alles klar, es werden demnach die Adobe Info Dictionary Daten genommen und nicht der XMP Stream (habe das auch nochmal getestet....).

Eine kleine Korrektur/Präzisierung auf Ihre Antwort: Es wird nicht gesucht wenn eine Datei an eine neue/bestehende Referenz angehängt wird - wenn in MINDESTENS EINEM FELD schon ein Eintrag vorliegt. Nur Referenz anlegen und dann Datei anhängen, ohne irgendwas eingetragen zu haben -> Citavi sucht...

Grüße

Kommentare (8)

Foto
1

Guten Tag Stefan

Darf ich auf Deutsch antworten?

Wenn Sie eine PDF-Datei importieren, durchsucht Citavi die Datei nach einer DOI-Adresse. Dieses Durchsuchen findet lokal statt. Das einzige, was Citavi überträgt, ist die gefundene DOI-Adresse. Wenn es eine DOI-Adresse findet, wird diese an crossref.org oder dataCite gesandt, um zu prüfen, ob die Anbieter bibliographische Meta-Daten bereitstellen. Falls ja, importiert Citavi diese auf Ihren PC.

Sie können auf den Import von PDF-Dateien verzichten und stattdessen zuerst die Titeldaten in Citavi manuell erfassen. Danach würden Sie die PDF-Datei mit dem neu angelegten Titel verknüpfen (weiter unten auf der Registerkarte "Titel", klicken Sie dort auf "Lokale Datei".).

Ausführliche Informationen, welche Daten Citavi nutzt, findne Sie hier: https://www1.citavi.com/sub/manual6/de/index.html?privacy_information.html

Freundliche Grüsse

Peter

Foto
1

Vielen Dank für die prompte Antwort.


Darf ich präzisieren (sorry...) - da in den Pivacy Informationen nicht alle Details abgebildet sind?


  • Das "importieren" von PDF's (-> Link) sucht immer nach einem Hinweis auf eine DOI lokal (auf den ersten drei Seiten - laut deutschen Manual, auf den ersten fünf Seiten laut englischen), das heißt das lässt sich nicht manuell abschalten?
  • Und wenn diese Gefunden wird, wird nur diese String/Zahlen Kombination hochgeladen? -> wichtigste Frage...
  • Es wird nicht nach PMID oder ISBN oder anderem geschaut?
  • Wenn das fehlschlägt, dann schaut es in den PDF-Eigenschaften:
  1. Nur in der PDF Adobe Info Dictionary Daten? oder auch
  2. im XMP Stream?


  • Das Anhängen einer PDF an eine bestehende Referenz (-> Link) führt nie dazu, dass die PDF durchsucht wird und Daten ins Netz geschickt werden (Ich habe keine Option bei Citavi gefunden bei der man NACHTRÄGLICH eine PDF zur Metadatensuche "ins Netz schicken könnte - wie das z.B. bei Zotero mit "Retrieve Metadata from PDF" geht!?) -> zwei wichtigste Frage


Hintergrund der Fragereie: Citavi in (hiesigem) Krankenhaus zu etablieren ist an gewisse Datenschutzdinge geknüpft, so dass die IT sichergestellt haben will, dass "nicht ausversehen" bzw. automatisch PDF's mit relevanten Informationen ins Netz gelangen; wenn man die durch eigenen Knopfdruck ausversehen hochlädt - dann ist die Schuldfrage klar...


Danke!

Foto
1

Hallo Stefan

Sie können nicht abschalten, dass die Funktion "PDF-Datei importieren", eine Suche nach einer DOI, ISBN oder PubMed-ID stattfindet. Das ginge nur, wenn Sie via Firewall Citavi die Verbindung zum Server sperren. Damit wäre aber auch die Recherche und die Suche nach Updates stillgelegt.

Wenn eine DOI/ISBN/PubMed-ID/ArXiv-ID gefunden wird, wird nur die übertragen.

Wenn keine DOI/ISBN/PubMed-ID/ArXiv-ID gefunden wird, versucht Citavi den Titel des Werks zu finden (grösste Überschrift) und nutzt diesen für eine Recherche bei Worldcat.

Wenn das misslingt, schaut Citavi in den Metadaten der PDF nach, also hier:

/4ea02e4333fdf2df60f846da88f82ab2

Wenn Sie eine PDF an eine bestehende Referenz hängen, wird diese PDF nicht durchsucht.

Freundliche Grüsse

Peter

Foto
1

Danke für die detaillierte Schilderung!

Dann dürfte ich zusammenfassen, dass ein vom Benutzer definiertes bzw. kontrolliertes Vorgehen über was, wann bzw. ob hochgeladen wird - wenn eine PDF importiert wird - nicht möglich ist? Ist klar gut für die Usability, aber nicht so gut für Datenprivacy/-hoheit. Ein kleiner Button "Wollen Sie oder wollen Sie nicht?" wäre diesbzgl. nett...

Klar - im einem PDF mit z.B. Patientenbezug (z.B. Fallinterviews prä qualitativer Auswertung -> mir ist klar, dass Citavi kein klassisches DMS ist und auch nicht MAXQDA, und eine solche Nutzung ggf. den Rahmen sprengt, wenn auch Citavi für genau ein solches Ziel bzgl. seiner Funktionalität hervorragende geeignet wäre) findet sich i.d.R. keine DOI/ISBN/PubMed-ID/ArXiv-ID, aber eben doch vielleicht "[eine] grösste Überschrift" mit Patientenbezug. Diese würde hochgeladen und das wäre theoretisch problematisch.

Mit den Metadaten -> alles klar, es werden demnach die Adobe Info Dictionary Daten genommen und nicht der XMP Stream (habe das auch nochmal getestet....).

Eine kleine Korrektur/Präzisierung auf Ihre Antwort: Es wird nicht gesucht wenn eine Datei an eine neue/bestehende Referenz angehängt wird - wenn in MINDESTENS EINEM FELD schon ein Eintrag vorliegt. Nur Referenz anlegen und dann Datei anhängen, ohne irgendwas eingetragen zu haben -> Citavi sucht...

Grüße

Foto
1

Hallo Stefan

Danke für Ihre Rückmeldungen. Ich bespreche mit einem Kollegen, ob/wie wir die PDF-Recherche - und sei es durch ein Citavi Add-on - konfigurierbar machen könnten.

Freundliche Grüsse

Peter

Foto
1

Vielen Dank für den guten Support!

Liebe Grüße

Foto
1

Hallo. Gibt es hierfür schon eine Rückmeldung? Herzliche Grüße - Stefan Kreisel

Foto
1

Hallo Stefan

Bitte entschuldigen Sie die urlaubsbedingt verspätete Antwort. Für Citavi 6.x kann ich Ihnen - ausser den oben beschriebenen Umweg, erst den Titel anzulegen und dann die PDF anzuhängen - noch keine Lösung anbieten.

Es gibt allerdings noch eine "Abkürzung für den Umweg": Legen Sie zuerst einen neuen Titel an (Sie müssen noch nichts ausfüllen). Ziehen Sie dann die PDF-Datei mit gedrückter Maustaste auf die Registerkarte "Titel", und war in den unteren Bereich. Sie lösen so keine Recherche aus. Wenn Sie dann die PDF-Datei in der Vorschau öffnen, können Sie die titelrelevanten Angaben kopieren und händisch in die passenden Felder einfügen.

Freundliche Grüsse

Peter

Foto
1

Danke für die Antwort! Genau

  • diese bzw.
  • die Lösung, dass schon einTitel angelegt und befüllt ist

führt dazu, dass keine Suche getriggert wird.

Mein Ausweg ist im Moment ein anderer - da ich häufig viele Dokumente importiere: ich switche jedes mal beim Import potentiell sensibler Dokumente den Proxy auf "Keinen Proxy benutzen", um den Netzzugang lahm zu legen - da der Ausgang aus dem Kliniknetz nur über einen Proxy geht... (würde gern hierfür ein Makro programmieren, finde aber keine detaillierteren Ausführungen zu möglichen Makro-Objekten diesbzgl.).

Meine Einlassungen zum Thema haben in meiner Organisation sehr wohl nochmal zu einem Denkprozess bzgl. Privacy mit Citavi angeregt - die Krankenhausumgebung ist hier eben sehr sensible. Von daher glaube ich bleibt es auch für Sie wichtiges Thema!?

Grüße

Stefan Kreisel

Foto
1

Hallo Stefan

Vielleicht ist bei aller Sorge noch zu bedenken, dass keiner der Anbieter bei denen wir Recherchen abholen, einen Bezug zwischen den recherchierten Daten und Ihrer Person herstellen kann. Als "Fragender" erscheint immer Citavi. Die Ergebnisse, die Sie speichern, bekommen ebenfalls nur Sie zu Gesicht, solange Sie Ihr Projekt nicht gezielt mit anderen teilen.

Bitte korrigieren Sie mich, wenn ich es falsch verstanden habe: Ihre Bedenken konzentrieren sich aktuell noch darauf, dass Citavi mit der Überschrift in einer PDF-Datei eine Recherche durchführt und in dieser Überschrift ggf. eine schützenswerte Information steht, ist das korrekt?

Freundliche Grüsse

Peter

Foto
1

Ich hatte Sie so verstanden:


Wenn eine DOI/ISBN/PubMed-ID/ArXiv-ID gefunden wird, wird nur die übertragen.
Wenn keine DOI/ISBN/PubMed-ID/ArXiv-ID gefunden wird, versucht Citavi den Titel des Werks zu finden (grösste Überschrift) und nutzt diesen für eine Recherche bei Worldcat.
Wenn das misslingt, schaut Citavi in den Metadaten der PDF nach, also hier:

D.h. das Programm sucht lokal - und das wäre ja eine wichtige Ergänzung, ob das tatsächlich so ist - nach DOI/ISBN/PMID/ArXiv und übermittelt nur diese Daten an die bekannten Suchserver.


Wenn es aber keine ID's findet, dann sucht es lokal (dito: "- und das wäre ja eine wichtige Ergänzung, ob das tatsächlich so ist -") nach der größten Überschrift (was das genau ist: Font-Größe? Fette Font? Nur der Absatz mit der Überschrift oder doch eine Zeile vorher oder nachher, etc.). Tatsächlich liegt hier das Bedenken (auch wenn natürlich unwahrscheinlich und natürlich klar in der Verantwortung des Users usw.), denn z.B.:

  • Importiert der User ausversehen z.B. einen Arztbrief - dort ist die größte Überschrift der Name und das Geburtsdatum des Patienten - dann wird das gesendet

Von daher wäre eine Lösung mit User-gesteuerten manuellen Retrieve sicherer (oder eine entsprechende Einstellung), s. z.B. Zotero->


a4e2bb7c924fc9f2891d9e5e7bccfb35


Herzliche Grüße!

Foto
1

Hallo Stefan

Nochmal besten Dank für Ihre geduldigen und konstruktiven Ausführungen (das ist ja auch nicht selbstverständlich).

Die Zotero-Lösung ist für uns nicht gangbar, aber ich bin sicher, dass meine Kollegen etwas finden, das im Ergebnis auf dasselbe rauskommt. Bis dahin schlage ich vor, dass Sie bei den betreffenden Dokumenten den Weg gehen, diese per Drag+Drop an einen leeren Titel zu hängen.

Freundliche Grüsse

Peter

Foto