Frage:
Faktendaten aus dem Internet entfernen und neu organisieren, um sie unter einer proprietären Lizenz zu veröffentlichen?
datasn.io
2015-08-24 11:39:34 UTC
view on stackexchange narkive permalink

Viele Informationen und chaotische Daten verteilen sich über das Internet, und es kostet einen Arm und ein Bein, sie zu etwas Größerem und Konsistentem zusammenzufassen, das sich als viel nützlicher erweisen würde.

Ist es rechtlich vertretbar, diese Fakten / Informationen von verschiedenen Websites zu kratzen , sie als Datenbanken / Datensätze zu kompilieren und neu zu organisieren, die dann unter einem proprietäre Lizenz ?

Bisher habe ich nach einigen Recherchen festgestellt, dass sachliche Daten nicht urheberrechtlich geschützt sein können, die jeweilige Zusammenstellung / Struktur von Daten jedoch. Bedeutet dies, dass ich mit den abgekratzten Fakten alles tun kann, solange ich meine eigene eindeutige Datenorganisation / -zusammenstellung / -struktur habe?

Zum Beispiel möchte ich ein Unternehmen gründen Informationsdatenbank von Hunderten verschiedener Websites und dann radikale Neuorganisation / Umstrukturierung / Neuindizierung dieser verschiedenen Datensätze in einer Datenbank, die besser ist als jede der Quellen. Kann ich diese von mir erstellte Datenbank lizenzieren ?

Ich weiß, dass ich die Daten niemals besitzen kann, da es sich um reine Fakten handelt. Richtig? Aber kann ich die jeweilige Datenorganisation EIGEN und rechtlich davon profitieren?

Wir sind in den USA tätig, aber die Daten könnten von Websites auf anderen Kontinenten stammen.

Kommentare sind nicht für eine ausführliche Diskussion gedacht. Diese Konversation wurde [in den Chat verschoben] (https://chat.stackexchange.com/rooms/99259/discussion-on-question-by-datasn-io-scraping-factual-data-off-the-web-and- re-org).
Drei antworten:
#1
+11
gracey209
2015-09-10 21:32:28 UTC
view on stackexchange narkive permalink

Aus Ihren Fragen sowie Ihren verschiedenen Kommentaren geht hervor, dass Sie zwei allgemeine Anfragen haben:

1. Liegt ein Verstoß gegen das Urheberrecht vor, wenn Sie beispielsweise Titel von Büchern, Spielen, Apps, Namen, Adressen (und eine andere Anzahl von Dingen) verwenden, die Sie dann in Datensätze einfügen, die für proprietäre kommerzielle Zwecke lizenziert werden?

Sie können Titel, Namen von Personen, Orten oder Dingen frei in Datensätze einfügen, ohne befürchten zu müssen, dass Sie gegen das Urheberrecht oder andere Gesetze verstoßen. Das ist klar.

Das Urheberrecht schützt keine Namen, Titel, kurzen Sätze oder Ausdrücke. Selbst wenn ein Name, ein Titel oder eine kurze Phrase neuartig oder unverwechselbar ist, kann sie nicht urheberrechtlich geschützt werden. Es macht also keinen Sinn, die Doktrin des fairen Gebrauchs in diesem Zusammenhang zu diskutieren, da Fair Use eine Verteidigung oder ein legaler sicherer Hafen ist, der lediglich eine Ausnahme von Urheberrechtsverletzungen darstellt, die es Menschen ermöglichen, ein urheberrechtlich geschütztes zu verwenden funktioniert unter bestimmten Umständen.

Soweit ich Ihr beabsichtigtes Bestreben verstehe, werden Sie keine Urheberrechte verletzen, sofern Sie lediglich sachliche Daten wie Namen von urheberrechtlich geschützten Dingen verwenden, um einen Datensatz oder eine Anwendung zur Unterstützung zu erstellen darauf zuzugreifen. Aus diesem Grund sage ich, dass Sie sich in Bezug auf dieses Problem nicht mit dem Test für fairen Gebrauch befassen müssen.

Das Copyright Office stellt klar, dass es trotz der Meinung der Leute keine exklusiven Rechte für kurze Kombinationen gibt von Wörtern wie:

• Namen von Produkten oder Dienstleistungen • Namen von Unternehmen, Organisationen oder Gruppen (einschließlich der Namen von ausführenden Gruppen) • Pseudonyme von Einzelpersonen (einschließlich Stift- oder Künstlernamen) • Titel von Werken • Schlagworte, Schlagworte, Mottos, Slogans oder kurze Werbeausdrücke • Auflistung der Zutaten wie in Rezepten, Etiketten oder Formeln. Wenn einem Rezept oder einer Formel eine Erklärung oder Anweisungen beigefügt sind, sind die Textrichtungen möglicherweise urheberrechtlich geschützt, das Rezept oder die Formel selbst bleibt jedoch nicht urheberrechtlich geschützt.

Daher sind diese Dinge nicht urheberrechtlich geschützt.

Während möglicherweise etwas an urheberrechtlich geschütztes Material angehängt oder in diesem enthalten ist, unterliegt es an und für sich nicht dem Schutz dieser Rechtsvorschriften. Wenn it (was auch immer es ist) nicht für ein Urheberrecht registriert werden kann, ist es nicht urheberrechtlich geschützt. Weil die Registrierung / Bekanntmachung von Urheberrechten seit 1989 optional war, als sich die USA der Berner Übereinkunft anschlossen, wobei der Schutz des Urheberrechts automatisch erfolgt, sobald ein Werk „in einem greifbaren Ausdrucksmittel fixiert“ ist (niedergeschrieben, aufgezeichnet, gemalt usw. .) Es ist geschützt. Es ist keine Ankündigung erforderlich. Die Registrierung ist nur für Rechtsstreitigkeiten oder Durchsetzungszwecke erforderlich. Dies ist jedoch für Ihre Anfrage ohnehin nicht relevant, soweit es sich um die tatsächlichen Daten handelt. Wenn Sie ganze Datenbanken für Ihren Zweck kopieren, ist diese Analyse anders.

2. Sie möchten das Internet nach Informationen "durchsuchen", die Sie in Ihre proprietären Datensätze aufnehmen und für kommerzielle Zwecke verwenden möchten, von denen sich einige oder die meisten bereits in einer Datenbank oder einer organisierten Form befinden, und Sie möchten wissen, ob es eine Art gibt des Urheberrechts oder der Pflicht der Person, die die Materialien ursprünglich in Datenbanken gespeichert hat?

Da Ideen, Verfahren, Prinzipien, Entdeckungen und Geräte ausdrücklich vom Urheberrechtsschutz ausgeschlossen sind, wenn Sie dies zusammenstellen möchten Art von Informationen aus dem Internet zum Zwecke der Erstellung von Datensätzen oder durchsuchbaren Datenbanken ist dies zulässig.

Das heißt, es gibt Schutz für bestehende Datenbanken nach dem Urheberrecht, die unter dem Konzept eines "Compilation Copyright" bereitgestellt werden. Ein Zusammenstellungs-Copyright schützt die Sammlung und kreative Zusammenstellung von Daten oder anderen Materialien . Zusammenstellungsrechte schützen das Sammeln und Zusammenstellen von Daten oder anderen Materialien, so dass Datenbanken im Allgemeinen als Zusammenstellungen urheberrechtlich geschützt sind.

Nach dem Urheberrechtsgesetz wird eine Zusammenstellung als "Sammeln und Zusammenstellen bereits vorhandener Materialien" definiert oder von Daten, die so ausgewählt sind, dass das resultierende Werk als Ganzes ein Originalwerk der Urheberschaft darstellt. " 17. U.S.C. § 101.

Die bereits vorhandenen Materialien oder Daten können urheberrechtlich geschützt sein, da die Auswahl der Materialien und die Form, die sie in einer vorhandenen Datenbank annehmen, original genug sein können, um einem Urheberrecht zu unterliegen. Die Daten selbst sind jedoch lediglich Informationen und können nicht geschützt werden.

Das Urheberrechtsgesetz sieht ausdrücklich vor, dass sich das Urheberrecht an einer Zusammenstellung nur auf die Zusammenstellung selbst und nicht auf die zugrunde liegenden Materialien oder Daten erstreckt. 17 U.S.C. § 103 (b). Infolgedessen können "Urheberrechte für die Zusammenstellung" nicht verwendet werden, um die Dinge zu schützen, die ansonsten nicht geschützt werden können.

Im Fall von Feist Publications, Inc. gegen Rural Telephone Service Company , Inc. entschied der Oberste Gerichtshof der USA, dass eine Zusammenstellungsarbeit wie eine Datenbank ein Mindestmaß an Kreativität enthalten muss, um nach dem Copyright Act geschützt werden zu können. Feist macht deutlich, dass selbst eine urheberrechtlich geschützte Datenbank nicht das Recht besitzt, eine Person daran zu hindern, sachliche Daten aus der Datenbank zu extrahieren (solange Sie nicht die gesamte Datenbank als Ganzes kopieren). Wenn Sie einen bereits kompilierten und urheberrechtlich geschützten Datensatz vollständig verwenden, müssen Sie eine Lizenz für dessen Verwendung erwerben. Wenn Sie jedoch nur große Datenmengen anhäufen, um sie dann in Ihren eigenen Datensatz aufzunehmen, können Sie dies tun.

Das große Problem wird sein (und Sie scheinen dies zu erkennen), wo Sie diese Daten sammeln werden. Einige Websites verfügen über spezielle Lizenzen, die besagen, dass Sie deren Inhalt nicht verwenden oder überarbeiten können. Oftmals werfen diese Websites diese Lizenzanforderungen jedoch einfach für Benutzer zur Verfügung, obwohl sie möglicherweise nicht (und einige würden argumentieren) nicht durchsetzbar sind.

Die Gerichte haben Argumente gehört, wonach "Verträge" (die Endbenutzerlizenzen) zum Schutz von Datenbanken und Informationen auf Websites, die über den urheberrechtlichen Schutz hinausgehen, durch das Urheberrechtsgesetz selbst "ausgeschlossen" werden sollten.

Die Das Vorkaufsargument lautet wie folgt: Das Bundesgesetz, das etwas kontrolliert, das dem zwischenstaatlichen Handel oder der zwischenstaatlichen Nutzung unterliegt, sollte durch das Bundesgesetz kontrolliert werden. Da die Bundesregierung das Urheberrechtsgesetz erlassen hat, um den Schutz von Originalwerken zu regeln, sollte es den Staaten (wohl) untersagt sein, widersprüchliche Gesetze zu erlassen.

Aufgrund der Fähigkeit eines Bundesgesetzes, das staatliche Recht zu verhindern, und der Tatsache, dass das Copyright Act bei 17 USA. § 301 legt spezifische Ausnahmeregelungen fest. Kein Staat darf Rechte schaffen, die einem der im Gesetz vorgesehenen ausschließlichen Rechte entsprechen.

Es ist dieses Konzept der Ausnahmeregelung, das verhindert, dass der Urheberrechtsschutz je nach Staat unterschiedlich ist ein Werk der Urheberschaft wird geschaffen. Dies gilt wohl auch für das Internet und das angebliche Vertragsverhältnis, das durch Lizenzen geschaffen wurde, die vorschreiben, wie nicht urheberrechtlich geschütztes Material verwendet werden darf.

Im Fall von ProCD, Incorporated gegen Matthew Zeidenberg und Silken Mountain Web Services, Inc. . Das Gericht prüfte, ob ein Endbenutzer einer CD-ROM-Telefondatenbank der Lizenz unterlag, als er einen großen Teil der Datenbank extrahierte und über das Internet zur Verfügung stellte.

Die Datenbank war fast identisch mit der Art der Daten im Fall Feist. Das Untergericht lehnte alle urheberrechtlichen Ansprüche ab und stellte fest, dass die Shrinkwrap-Lizenz, die das Recht des Endbenutzers zur Nutzung der Daten kontrollierte, nicht durchsetzbar war (als Shrink Wrap) Lizenz) und durch das Urheberrechtsgesetz ausgeschlossen. Infolgedessen stand dem Ersteller der Telefondatenbank keine Erleichterung zur Verfügung, und der Endbenutzer konnte die Daten extrahieren und nach eigenem Ermessen verwenden. Im Berufungsverfahren wurde diese Entscheidung jedoch rückgängig gemacht (7. Stromkreis).

Das Berufungsgericht erkannte an, dass die Datenbank (auf der CD) nicht original genug war, um urheberrechtlich geschützt zu sein (bis zum Ende wurde keine Urheberrechtsverletzung festgestellt) -Nutzer); Sie stellten jedoch fest, dass der Endbenutzer eine Vertragsverletzung war, da die Shrink-Wrap-Lizenz das Verhalten des Endbenutzers untersagte.

Dies sagt uns, dass diese Lizenzen (auf Websites) möglicherweise durchsetzbar sind oder nicht. Während der 7. Stromkreis trotz des Vorkaufsarguments ein Vertragsrecht gemäß der Lizenz feststellte, kann ein anderes liberaleres Berufungsgericht etwas anderes feststellen. Dies war auch eine Diskette, nicht das Internet, das den "wilden Westen" der Informationen darstellt, der weitgehend unreguliert und nicht legitimiert ist, da er die Rechtmäßigkeit und Durchsetzbarkeit (einiger) bestehender Vorschriften betrifft. Lizenzvereinbarungen für die Nutzung der Website im Internet gibt es überall. Wenn Sie eine Datenbank von einer Site mit einer Lizenz nehmen, die besagt, dass Sie ihre Arbeit nicht übernehmen und hinzufügen können, oder was auch immer, und Sie sie anderen Datenbanken hinzufügen, die nicht lizenziert sind, und dann Ihren eigenen Datensatz erstellen, sind Sie dies wahrscheinlich NICHT wird das Urheberrecht von irgendjemandem verletzen. Das heißt, Sie verstoßen möglicherweise gegen den Vertrag (die Lizenz), wenn sie davon erfahren, und verklagen Sie (wenn Sie ihn verwenden, werden Sie nicht verletzt; nur wenn Sie verklagt werden und ein Gericht feststellt, dass Sie gegen die Bestimmungen verstoßen, werden Sie verletzt Es mag eine erwägenswerte Unterscheidung sein, aber das liegt bei Ihnen. Die sicherste Wette wäre, eine Lizenz von ihnen zu erhalten, um die Materialien zu überarbeiten. Wenn das Material allgemein genug ist und so geändert wird, dass Sie Ihr eigenes neues (urheberrechtlich geschütztes) Werk erstellen, bin ich mir nicht sicher, woher sie wissen, dass Sie die Daten "im Widerspruch zu ihrer Lizenzvereinbarung" gesäubert haben (ich habe keine Ahnung) Wenn Codierungen oder Metadaten so angehängt sind, dass sie auf diese Weise identifizierbar sind. Ich habe keinen technischen Hintergrund und befürworte nicht, das zu nehmen, was nicht Ihnen gehört. Aber wenn sie es können und wissen, können sie Probleme für Sie verursachen.

Abschließend möchte ich nur sagen, dass das Internet mit Websites übersät ist, die Urheberrechte beanspruchen oder nicht durchsetzbare Lizenzen für Material auferlegen, das für die öffentliche Nutzung reif ist. Nur weil es besagt, dass es ihnen gehört, ist dies nicht der Fall. Das Gegenteil ist auch der Fall Nur weil eine Website kein Urheberrecht an etwas beansprucht, heißt das nicht, dass sie gemeinfrei ist.

Ich würde empfehlen, sich entweder an gemeinfreie Websites zu halten / diese für Ihre Scrubbing-Bemühungen zu verwenden oder Berechtigungen von den Websites einzuholen, die Lizenzanforderungen auferlegen. Abgesehen davon würde ich empfehlen (wie ich es bereits getan habe), ein formelles Rechtsgutachten einzuholen, um zu sagen, dass Sie niemandem Urheberrechte auferlegen (dies könnte nur geschehen, wenn Sie einem Anwalt jeden Ort gezeigt haben, von dem Sie Material genommen haben, sowie was Das Material ist) und die Lizenzen von Websites mit allgemeinen Informationen, die möglicherweise versuchen, die Nutzung einzuschränken, sind nicht durchsetzbar. Ich würde dies tun, bevor Sie viel Zeit oder Geld in etwas investieren, das größtenteils auf der Anhäufung des Arbeitsprodukts anderer Menschen basiert.

Ich wünschte, es gäbe eine sichere Antwort, aber es gibt einfach keine ohne am Ende alles sehen.

Es lohnt sich immer, eine Antwort von @gracey209 zu lesen, wenn auch nur für die kleinen Perlen, wie zum Beispiel: "* Das Internet ist übersät mit Websites, die Urheberrechte beanspruchen oder nicht durchsetzbare Lizenzen für Material auferlegen, das für die öffentliche Nutzung reif ist. Nur weil es sagt, dass es ihnen gehört." mach es nicht so. * "
Vielen Dank für eine so ausführliche Antwort! Es scheint ein paar Tage zu dauern, bis ich alles verdaut habe.
@kavoir, Sie sind herzlich willkommen. Danke für das Kopfgeld! Viel Glück. Lassen Sie es mich wissen und wir können uns unterhalten, wenn Sie weitere Fragen haben, nachdem Sie alles überlegt haben.
#2
+6
Joe
2015-08-24 21:52:37 UTC
view on stackexchange narkive permalink

Es ist tatsächlich unmöglich zu antworten, ohne zu wissen, wo Sie dies beabsichtigen. In den USA können Sammlungskriterien für die Präsentation von & urheberrechtlich geschützt werden. An einigen anderen Orten (z. B. im Vereinigten Königreich & Europe) sind Datenbanken durch sui generis Datenbankrechte geschützt.

Sie möchten verfolgen, wann & Woher haben Sie die einzelnen Daten und unter welchen Lizenzen wurden sie bereitgestellt, um die Wahrscheinlichkeit einer langwierigen Klage zu verringern? ( Wenn wichtig ist, da Websites möglicherweise ihre Lizenzbedingungen ändern, sollten Sie an jedem Tag, an dem Sie sie abgekratzt haben, eine Momentaufnahme der Lizenzbedingungen erstellen.)

Außerdem Beachten Sie, dass einige "Fakten" als Sätze geschrieben oder als Grafiken dargestellt werden. In den USA sind diese urheberrechtlich geschützt, ebenso wie Fotos, die Fakten darstellen. Nehmen wir den Fall von TV-Sendungen: Die Zeit, zu der eine Sendung auf einem bestimmten Kanal geplant ist, ist eine Tatsache und in den USA nicht urheberrechtlich geschützt. Die Zusammenfassung der Episode ist jedoch eine kreative Arbeit und urheberrechtlich geschützt. Kreative Filterung (Auswahl) oder Präsentation können urheberrechtlich geschützt sein. Dieses Problem wurde in Feist v. Rural offen gelassen.

Ich wollte fast genau dies in einen Kommentar schreiben und dann die Frage mit tatsächlichen Fakten zu all diesen Dingen eingrenzen.
#3
+1
Alexanne Senger
2015-09-09 05:04:04 UTC
view on stackexchange narkive permalink

Kurze Antwort

Sie müssen keine Daten an Ihre Benutzer lizenzieren, um Einnahmen zu erzielen, wenn Sie eines der folgenden Geschäftsmodelle anwenden.

  • Software als Service (SaaS)

  • Pay-per-Use-Webanwendung

  • Daten-API

/ blockquote>

Erklärung

Es hört sich so an, als wären Sie es Beschreiben eines der oben genannten Geschäftsmodelle in Ihrer Frage. In allen Fällen liegt der Wert Ihrer neu organisierten Datensätze in der Art und Weise, wie Ihre App oder Ihr Dienst es dem Benutzer ermöglicht, mit ihm zu interagieren, um nützliche Dinge zu tun. Ich denke, Sie möchten oder müssen die Datensätze möglicherweise überhaupt nicht lizenzieren. Sie müssen lediglich den Service und die Verwendung Ihrer Software, App oder API in Rechnung stellen.

Implementieren eines Daten-API-Modells

Wenn Sie sich lieber nur auf die Daten konzentrieren und Ihre Benutzer ihre eigenen Apps erstellen lassen möchten, ist die Erstellung einer Daten-API möglicherweise die beste Option. Mit diesem Produkt können Ihre Benutzer RESTful HTTP-Anforderungen an Ihren Datendienst senden.

Der Dienst antwortet (höchstwahrscheinlich) mit einem JSON-P starker Rückruf zur Bereitstellung der Daten. Sie müssten alle von Ihrer API verfügbaren Methoden sowie Beispielaufrufe in verschiedenen gängigen Sprachen gründlich dokumentieren. (Beginnen Sie mit cURL , da dies relativ universell ist.)

In diesem Modell würden Sie wie in den anderen Modellen allen Benutzern Berechtigungsnachweise ausstellen (dies würden sie bezahlen zum). Dann würden sie bei jedem Datenanruf diese Anmeldeinformationen bereitstellen, die wiederum serverseitig überprüft würden, bevor die Antwort gesendet wird.


Haftungsausschluss : Ich nicht ein Anwalt, also folge nicht meinem Rat. Wenden Sie sich an einen echten Anwalt, da dies der einzige Weg ist, um sicherzustellen, dass Sie keine Probleme haben.
Vielen Dank. Das ist mehr oder weniger das, was ich vorhabe, aber der Kernwert sind immer noch die Daten und nicht die Anwendung. Wir werden unseren Kunden / Kunden ermöglichen, auf einfache Weise ihre eigenen Anwendungen auf unseren Daten aufzubauen, aber am Ende werden wir uns nur auf den Datenteil konzentrieren. Was wir also direkt monetarisieren, sind immer noch die Daten, nicht die Anwendung. Irgendeine weitere Idee bitte?
@kavoir.com: Ich habe meine Antwort basierend auf Ihrem Feedback aktualisiert. Sie möchten höchstwahrscheinlich eine *** Daten-API *** erstellen und die Verwendung dieser API lizenzieren. Lesen Sie diesen Teil meiner Antwort daher genau durch.
Schöne technische Details. Vielen Dank! Sie sind kein Anwalt, aber sicherlich ein böser (auf coole Weise :)) Programmierer. Dies sind großartige Ratschläge und ich werde ihnen auf jeden Fall folgen. Was mich jedoch mehr beunruhigt, sind die Websites, von denen ich kratze, die mich verklagen könnten, weil ich von Fakten auf ihrer Website profitiert habe. Es scheint, als würde ich API-Anfragen berechnen, aber der Kernwert sind immer noch die Daten. Wenn ich die Daten nicht lizenziere, was soll ich sagen, wenn ein Kunde mich fragt, um welche Lizenz es sich handelt und in welchem ​​Umfang er unsere Daten verwenden kann? Am Ende verkaufe ich die Daten, nicht die Abonnement- oder API-Anfragen.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...