Offene Daten¶
Themenbezogener Überblick über öffentliche Repositories mit Forschungsdaten.
Agrarwissenschaften¶
- AQUASTAT Dissemination System
Globales Informationssystem der Food and Agriculture Organization of the United Nations (FAO) zu Wasserressourcen und landwirtschaftlicher Wasserbewirtschaftung
- Data Commons Agriculture
Data Commons führt öffentliche Daten aus vielen Teilen der Welt zusammen, darunter auch Umfragen
- FoodData Central
Daten zur Lebensmittelzusammensetzung des US Ministerium für Landwirtschaft (USDA)
- Hyperspectral benchmark dataset on soil moisture
Hyperspektral- und Bodenfeuchtedaten aus einer Lysimeter-Feldkampagne auf der Grundlage einer Bodenprobe. Karlsruhe (Deutschland), 2017
- Index DataBase
Vegetationsindizes des Instituts für Nutzpflanzenwissenschaften und Ressourcenschutz (INRES)
- PLANTS Database
Standardisierte Informationen über Gefäßpflanzen, Moose und Flechten in den USA
Bildverarbeitung¶
- 10k US Adult Faces Database
Über zehntausend natürliche Gesichtsfotos sowie verschiedene Messwerte für 2.222 dieser Gesichter, darunter Einprägsamkeitswerte, psychologische Merkmale Merkmale sowie Anmerkungen zu Orientierungspunkten
- Action Similarity Labeling (ASLAN) Challenge
Videodatenbank mit Handlungen und einem umfassenden Testprotokoll zur Untersuchung der Ähnlichkeit von Handlungen
- Affective Image Classification
Affektive Bildklassifizierung unter Verwendung von Merkmalen, die von der Psychologie und der Kunsttheorie inspiriert sind
- AI Detector Arena Benchmark Dataset
Datensatz zur Bewertung von KI-Bilderkennungswerkzeugen
- Airborne Object Tracking Dataset (AOT)
Datensatz zur Verfolgung von Flugobjekten
- All-Age-Faces (AAF) Database
Der All-Age-Faces (AAF)-Datensatz enthält 13.322 Gesichtsbilder überwiegend asiatischer Personen aus allen Altersgruppen
- animals with attributes
Ein Datensatz für die attributbasierte Klassifizierung
- Arabic Font Classification
Klassifizierung arabischer Schriftarten, s. a. Arabic Font Classification
- Biometrically Filtered Famous Figure (B3FD) Dataset
Datensatz mit Gesichtsbildern zur Altersschätzung
- CADDY Underwater Stereo-Vision Dataset
Human-Robot Interaction (HRI) für Taucher und autonomes Unterwasserfahrzeuge
- Caltech Vision Lab Datasets
Siehe auch caltechvisionlab.github.io
- Cat Dataset
Über 9.000 Bilder von Katzen mit beschrifteten Gesichtsmerkmalen
- CCAgT
Bilder von Gebärmutterhalszellen, gefärbt mit der AgNOR-Methode
- Chars74K dataset
Zeichenerkennung in natürlichen Bildern
- Cube++
4890 Bilder verschiedener Szenen unter unterschiedlichen Bedingungen
- Danbooru2021
Umfangreiche Anime-Bilddatenbank mit über 4,9 Millionen Bildern und über 162 Millionen Tags
- Densely Annotated Video Driving Data Set
28 im CARLA-Simulator aufgezeichnete Fahrsequenzen mit insgesamt 10.767 Einzelbildern
- ETH Entomological Collection (ETHEC) Dataset
Daten für die hierarchische Bildklassifizierung unter Verwendung von Entailment-Cone-Einbettungen
- Face Image Project
Ungefilterte Gesichter zur Geschlechts- und Altersklassifizierung
- Face Recognition Databases
Datensätze zum Benchmarking von Gesichtserkennungsalgorithmen
- FlickrLogos
Firmenlogos von Flickr in verschiedenen Situationen
- Fluorescent Neuronal Cells v2
Sammlung von Fluoreszenzmikroskopiebildern und den dazugehörigen Referenz-Annotationen
- HumanEva Dataset
Sieben kalibrierte Videosequenzen, die mit 3D-Körperhaltungen synchronisiert sind
- IEEE DataPort: Image Processing
IEEE-Datensätze zur Bildverarbeitung
- ImageNet
Bilddatenbank, die nach der WordNet-Hierarchie gegliedert ist
- Indoor Scene Recognition
Bilder für die Erkennung von Innenräumen
- Iranis Dataset
Umfangreicher Datensatz mit mehr als 83.000 Bildern von persischen Zahlen und Buchstaben, die aus realen Kfz-Kennzeichen stammen
- KITTI Vision Benchmark Suite
Computer-Vision-Benchmarks für reale Umgebungen mit den Schwerpunkten Stereo, optischer Fluss, visuelle Odometrie, 3D-Objekterkennung und 3D-Tracking
- Labeled Information Library of Alexandria: Biology and Conservation (LILA BC)
Repository für Datensätze aus den Bereichen Biologie und Naturschutz
- Labelled Faces in the Wild (LFW) Dataset
Datenbank mit Gesichtsfotos, die zur Untersuchung des Problems der uneingeschränkten Gesichtserkennung
- LLVIP: A Visible-infrared Paired Dataset for Low-light Vision
Gepaarte Sichtlicht-Infrarot-Datensätze für die Bildverarbeitung bei schlechten Lichtverhältnissen
- Multi-View Region of Interest Prediction Dataset for Autonomous Driving
Im CARLA-Simulator aufgenommene Multi-View-Bilder mit Markierungen für Bereiche von Interesse
- Newspaper Navigator
Experimentelle Anwendung zum Auffinden historischer Zeitungsbilder anhand visueller Ähnlichkeit
- Open Images Dataset V6
1.743.042 Trainingsbilder mit Begrenzungsrahmen, Objektsegmentierungen, visuelle Beziehungen und lokalisierten Beschreibungen
- Oxford-IIIT Pet Dataset
Datensatz mit 37 Kategorien zu Haustieren
- Roboflow Computer Vision Datasets
Öffentliche Datensätze für Computer Vision
- Stanford Dogs Dataset
Bilder von 120 Hunderassen aus aller Welt mit Annotationen aus ImageNet
- SUN database project
Sammlung annotierter Bilder mit einer großen Vielfalt an Umgebungsszenen, Orten und den darin befindlichen Objekten
- SVIRO Dataset and Benchmark
Synthetic dataset for Vehicle Interior Rear seat Occupancy (SVIRO) ist ein synthetischer Datensatz zur Erkennung und Klassifizierung der Belegung der Rücksitze im Fahrzeuginnenraum
- TikTok dataset
Auf der CVPR 2021 veröffentlichter Datensatz, der in der Arbeit „Learning High Fidelity Depths of Dressed Humans by Watching Social Media Dance Videos“ vorgestellt wurde
- Violent-Flows Database
Datenbank und Benchmark für Gewalt in Menschenmengen und Gewaltfreiheit
- Visual Genome
Datensatz und Wissensdatenbank, um strukturierte Bildkonzepte mit Sprache zu verknüpfen
- X-ray images
Die in GDXray+ enthaltenen Röntgenbilder dürfen ausschließlich für Forschungs- und Bildungszwecke verwendet werden
- YouTube-BoundingBoxes Dataset
Umfangreicher Datensatz aus Video-URLs mit dicht gestreuten, hochwertigen Annotationen von Begrenzungsrahmen für einzelne Objekte
- YouTube-8M Segments
Von Menschen verifizierte Labels für etwa 237.000 Segmente in 1.000 Klassen
Biologie¶
- American-Gut
Open-Access-Code und IPython-Notebooks des American Gut-Projekts
- ArrayExpress - Functional Genomics Data
Daten aus Experimenten der funktionellen Genomik
- Catalogue of Life (COL)
Integrierte Liste aller weltweit bekannten Arten
- Cell Image Library (CIL)
Über 12.000 Datensätze des Center for Research in Biological Systems (CRBS)
- CytoImageNet
Umfangreicher Datensatz für das Vortraining mit Mikroskopiebildern
- Electron Microscopy Data Bank (EMDB)
Daten aus der Kryo-Elektronenmikroskopie (Kryo-EM) sowie für repräsentative Tomogramme von makromolekularen Komplexen und subzellulären Strukturen
- EMBL-EBI
Datenquellen und Analysewerkzeuge des Europäischen Bioinformatik-Instituts des Europäischen Laboratoriums für Molekularbiologie (EMBL)
- ENCODE portal
Das ENCODE-Konsortium ist ein fortlaufendes internationales Kooperationsprojekt von Forschungsgruppen, das vom National Human Genome Research Institute (NHGRI) finanziert wird
- EnsemblGenomes
Genomdaten für wirbellose Arten sowie Werkzeuge zur Bearbeitung, Analyse und Visualisierung dieser Daten
- FireBrowse portal
FireBrowse bietet Zugriff auf eine Vielzahl von Daten zur Krebsgenomik, darunter klinische Anmerkungen, DNA-Kopienzahl, miR, miRseq, mRNA und mRNAseq
- Gene Expression Omnibus
Funktionelle Genomikdaten, das die Einreichung von MIAME-konformen Daten unterstützt
- Gene Ontology
Gene Ontology (GO)-Wissensdatenbank zu den Funktionen von Genen
- Genomic Data Commons Data Portal
Daten aus genomischen Krebsstudien
- Global Biotic Interactions (GloBI)
Daten über Arteninteraktionen, z. B. Raubtier-Beute, Bestäuber-Pflanze, Erreger-Wirt, Parasit-Wirt
- ICOS PSP benchmarks
Sammlung praxisnaher Benchmarks, die sich zum Testen der Skalierbarkeit von Klassifizierungs- und Regressionsmethoden der ICOS-Forschungsgruppe
- IGSR: The International Genome Sample Resource
Im Rahmen des »1000-Genome«-Projekts wurde ein Katalog häufiger genetischer Variationen beim Menschen erstellt
- Journal of Cell Biology
Eine Sammlung von Bilddaten zu Artikeln, die im »Journal of Cell Biology« eröffentlicht wurden.
- KEGG: Kyoto Encyclopedia of Genes and Genomes
Datenbank zu übergeordneten Funktionen und Zusammenhängen biologischer Systeme wie Zellen, Organismen, Ökosysteme und der Biosphäre anhand von Informationen auf molekularer Ebene
- NIH Human Microbiome Project Catalog
Metadaten zu allen Referenzgenomen von Isolaten mit Bezug zum Menschen sowie zu Proben des Metagenoms gesunder Menschen
- National Center for Biotechnology Information
Datenbanken, u. a. zu Chemikalien und Bioassays, DNA und RNA, Homologie
- openSNP
Repository für genetische und phänotypische Daten
- palmerpenguins
Datensatz für die Datenexploration und -visualisierung als Alternative zu Iris
- Pathguide
Ressourcen zu biologischen Signalwegen und molekularen Interaktionen
- RCSB Protein Data Bank (RCSB PDB)
Daten zu experimentell ermittelte 3D-Strukturen, integrativen 3D-Strukturen und computergenerierten Strukturmodellen (CSM)
- Personal Genome Project
Öffentlich zugängliche Daten zu Genom, Gesundheit und Merkmalen
- PGC Data Access Portals
Portale dienen der Abfrage von Daten auf individueller Ebene bzw. mit eingeschränktem Zugriff
- Rfam
Sammlung von RNA-Familien, die jeweils durch Multiple sequence alignment (MSA), Konsensus-RNA-Strukturen und Kovarianzmodelle dargestellt werden
- SSBD:database
Offene Ressourcen zur Analyse von Mikroskopbildern und quantitativen Daten biologischer Objekte, wie Einzelmoleküle, Zellen, Gewebe, Individuen usw.
- UniGene
NCBI-Datenbank zum Transkriptom und somit nicht in erster Linie eine Datenbank für Gene
- UniProt
Frei zugängliche Quelle für Proteinsequenzen und funktionelle Informationen
- UCSC Genome Browser
Sequenz- und Annotationsdaten für die im UCSC Genome Browser dargestellten Génomsequenzen
Chemie¶
- Ionic Liquids Database - ILThermo
Online-Recherchetool für thermodynamische und Transporteigenschaften von ionischen Flüssigkeiten sowie von binären und ternären Gemischen, die ionische Flüssigkeiten enthalten
- PubChem
Sammlung frei zugänglicher chemischer Informationen des «National Center for Biotechnology Information»
Computernetzwerke¶
- CAIDA Data
Internet-Topologie der Anordnung und Vernetzung von Geräten innerhalb autonomer Systeme (AS) des Internets
- Click Dataset
Rund 53,5 Milliarden HTTP-Anfragen von Nutzer*innen der Indiana University
- ClueWeb09 Dataset
Etwa 1 Milliarde Webseiten in zehn Sprachen, die im Januar und Februar 2009 gesammelt wurden
- ClueWeb12 Dataset
733.019.372 englischsprachige Webseiten, die zwischen dem 10. Februar 2012 und dem 10. Mai 2012 erfasst wurden
- Common Crawl
Freies, offenes Repository mit Web-Crawling-Daten
- Criteo 1TB Click Logs Dataset
Merkmalswerte und Klickdaten für Millionen von Display-Anzeigen um Algorithmen zur Vorhersage der Klickrate (CTR) zu bewerten
- Merklemap DNS records database
Datenbank für DNS-Einträge mit mehr als 4 Milliarden Einträgen
- MIRAGE Project
Reproduzierbare Architektur zur Erfassung des Datenverkehrs mobiler Apps und zur Erstellung von Referenzdaten
- MobiPerf
MobiPerf ist eine Open-Source-Anwendung zur Messung der Netzwerkleistung (Durchsatz, Latenz etc.) auf mobilen Plattformen
- Shopper Intent Prediction from Clickstream E‑Commerce Data
Vorhersage der Kaufabsicht anhand von E-Commerce-Clickstream-Daten
- Stanford Internet Research Data Repository
Öffentliches Archiv mit Forschungsdatensätzen, die Hosts, Dienste und Websites im Internet beschreiben
- Open Observatory of Network Interference (OONI)
Gemeinnütziges freies Software-Projekt, dessen Ziel es ist, dezentrale Initiativen zur Dokumentation von Internetzensur weltweit zu unterstützen
- Project Sonar
SSL-, DNS-, HTTP- und UDP-Verbindungen öffentlicher Netzwerke
- UCSD Network Telescope
Passives System zur Verkehrsüberwachung, das auf einem weltweit verteilten, aber nur gering ausgelasteten /9- und /10-Netzwerk basiert.
Energiesektor¶
- Almanac of Minutely Power dataset (AMPds)
Messdaten zu Strom, Wasser und Erdgas im Minutentakt aus zwei Jahren
- Commercial Building Energy Dataset (COMBED)
Energiebezogener Datensatz aus einem Geschäftsgebäude, bei dem die Daten mehr als einmal pro Minute erfasst wurden
- Direct Borohydride Fuel Cell (DBFC) Dataset
Impedanz- und Polarisationsmessung an der Anode mit Pd/C-, Pt/C- und Pd-beschichteten Ni–Co/rGO-Katalysatoren
- Domestic Electrical Load Survey (DELS) Secure Data 1994–2014
Der „DELS Secure Data“-Datensatz enthält anonymisierte Umfrageantworten
- ECO data set (Electricity Consumption & Occupancy)
Nicht-intrusive Lastüberwachung und Anwesenheitserkennung im Zeitraum von acht Monaten in sechs Schweizer Haushalten
- EIA-923
Der Fragebogen EIA-923 erfasst detaillierte Stromdaten zu Stromerzeugung, Brennstoffverbrauch, Vorräten an fossilen Brennstoffen sowie Wareneingängen auf Ebene der Kraftwerke und der Antriebsmaschinen
- Global Power Plant Database
Weltweite Open-Source-Datenbank für Kraftwerke
- Household Electricity Study - EV0702
Daten zum Stromverbrauch in Haushalten von April 2010 bis April 2011 von Haushaltsgeräten in insgesamt 251 Eigenheimbewohnerhaushalten in ganz England
- High Frequency EMI Data Set (HFED)
Datensatz zu hochfrequenten elektromagnetischen Störungen (EMI) mit Messkurven, die von einem Signalanalysator und einem Universal Software Radio Peripheral (USRP) stammen
- Moroccan buildings’ electricity consumption dataset (MORED)
Daten zum Stromverbrauch verschiedener städtischer Gebäude in marokkanischen Städten
- Marktstammdatenregister (MaStR)
Stammdaten des Strom- und Gasmarktes
- Proton Exchange Membrane (PEM) Fuel Cell Dataset
Standardtests an Nafion-112-Membranen sowie MEA-Aktivierungstests einer PEM-Brennstoffzelle unter verschiedenen Betriebsbedingungen
- Plug Load Appliance Identification Dataset (PLAID)
Spannungs- und Strommessungen mit einer Abtastrate von 30 kHz an 11 verschiedenen Gerätetypen in mehr als 60 Haushalten in Pittsburgh, Pennsylvania
- Public Utility Data Liberation Project (PUDL)
Open-Source-Datenverarbeitungs-Pipeline, die den Zugriff auf US-Energiedaten sowie deren programmgesteuerte Nutzung erleichtert
- Smart Meter Data Listing
Liste mit Datensätzen zu Smart Meter
- SynD
Synthetic energy dataset for non-intrusive load monitoring in households (SynD) liefert einen synthetischen Energiedatensatz mit Schwerpunkt auf Wohngebäude
- tracebase data set
Sammlung von Stromverbrauchsdaten für Forschungszwecke im Bereich der Energieanalyse
- UK Domestic Appliance-Level Electricity (UK-DALE) dataset
Strombedarf von fünf Häusern und einzelner Geräte alle sechs Sekunden
- Indian Dataset for Ambient Water and Energy
Energieüberwachung und Energieverbrauch eines Hauses in Indien für 73 Tage
Finanzsektor¶
- BIS Data Portal
Die Bank für internationalen Zahlungsverkehr Bank for International Settlements (BIS) stellt Statistiken in Zusammenarbeit mit Zentralbanken und anderen nationalen Behörden
- Cboe Futures Exchange Market Data
Tägliche Marktstatistiken und Abschlusskurse, Kursübersicht und weitere Marktdaten-Services
- EDGAR
Electronic Data Gathering, Analysis, and Retrieval (EDGAR) ist das zentrale System für Unternehmen, die Unterlagen gemäß Securities Act, Securities Exchange Act, Trust Indenture Act und Investment Company Act einreichen
- FAANG- Complete Stock Data
Daten zu den Aktien der FAANG (Facebook, Amazon, Apple, Netflix und Google)-Unternehmen seit Beginn ihrer Börsennotierung
- Federal Reserve Economic Data (FRED)
Online-Datenbank, die Hunderttausende von Zeitreihen mit Wirtschaftsdaten aus zahlreichen nationalen, internationalen, öffentlichen und privaten Quellen umfasst
- Google Finance
Suche nach Aktien, ETFs etc.
- Nasdaq Data Link
Plattform für Finanz- und alternative Daten, die Finanzfachleuten nützliche Informationen und Tools für die Erfassung, Verwaltung und Analyse von Daten bietet
- NYSE Exchange Proprietary Market Data
Echtzeit-Marktdaten mit geringer Latenz decken die verschiedenen Anlageklassen und Märkte der NYSE Group ab
- Yahoo Finance
Finanznachrichten, Daten und Kommentare, darunter Aktienkurse, Pressemitteilungen, Finanzberichte und eigene Inhalte
Geo- und Umweltwissenschaften¶
- AODN Portal
Daten des Australian Ocean Data Network (AODN) und des Integrated Marine Observing System (IMOS)
- Alabama’s Real-Time Coastal Observing System (ARCOS)
Umweltüberwachungsdaten in und um die Mobile Bay
- BODC Database
Sammlung von Meeresdatensätzen des British Oceanographic Data Centre (BODC)
- Common Metadata Repository (CMR)
Such-API für die Metadaten der NASA zu fernerkundeten Geowissenschaften
- Earth Models
Modellierungswerkzeuge und Datensätze zur Erde
- Earthdata Data Catalog
Das „Earth Science Data Systems“ (ESDS) Programm bietet freien Zugang zum Archiv der NASA mit geowissenschaftlichen Daten
- Earthquake Catalog
Aktuelle oder vergangene Erdbeben, Erdbebenressourcen nach Bundesstaaten und Webdienste
- Global Volcanism Program
Katalog der Vulkane des Holozäns und Pleistozäns sowie ihrer Ausbrüche aus den letzten 12.000 Jahren
- Global Wind Atlas
Webbasierte Anwendung für um Entscheidungsträger, Planer und Investoren, um Gebiete mit starken Winden für die Windenergieerzeugung zu identifizieren
- Meteoritical Bulletin Database
Internationale Datenbank offiziell anerkannter Meteoriten und ihrer Fundorte
- National Data Buoy Center
Meteorologische und ozeanografische Messungen für die Meeresumwelt
- National Estuarine Research Reserve System
Kurzfristige Schwankungen und langfristige Veränderungen in der Integrität und Biodiversität der Flussmündungsökosysteme und Küstengewässer
- Norwegian Polar Data Centre: Datasets
Antarktis, Arktischer Ozean und Spitzbergen
- PANGAEA Publisher for Earth & Environmental Science
Georeferenzierte Daten zu Chemie, Lithosphäre und Atmosphäre, Biologie und Paläontologie, Ozeanen und Landflächen, Fischerei und Landwirtschaft etc.
- Radiance – Global Light Pollution Visualization & Analysis
Für Astrofotografie, Astrophysik und den Schutz des Nachthimmels
- UC Irvine Machine Learning Repository
Datensätze zum maschinellen Lernen mit Daten zur Luftqualität, zur Erkennung von Ozonwerten, zur Konzentration von Treibhausgasen, zur aquatischen Toxizität und mehr
- UK National Data Repository (NDR) for offshore petroleum-related licence information
In Zukunft sollen auch Aufzeichnungen zu Lizenzen für die Erkundung und Speicherung von Kohlendioxid gespeichert werden
- WHPA Prediction
Datensatz im Rahmen der Studie A new framework for experimental design using Bayesian Evidential Learning
Siehe auch
Gesundheitswesen¶
- covid-19-lake
AWS S3 Explorer
- COVID-19 Case Surveillance Public Use Data
COVID-19-Fallüberwachung bis zum 1. Juli 2024
- Health Inspection Scores (2024-Present)
Ergebnisse der Gesundheitsinspektionen, die vom Gesundheitsamt San Francisco von 2024 bis heute durchgeführt wurden
- Novel Coronavirus (COVID-19) Cases, provided by JHU CSSE
COVID-19-Datenbank des Center for Systems Science and Engineering (CSSE) an der Johns Hopkins University (archiviert am 10. März 2023)
- NYT Coronavirus (Covid-19) Data in the United States
Eine Datenbank mit Daten zu Coronavirus-Fällen und Todesfällen in den USA
- HealthData.gov
Daten, Tools und Ressourcen aus dem Bereich Gesundheit und Soziales
- The COVID Tracking Project
Gemeldete Daten in unterschiedlichen Einheiten und nach unterschiedlichen Definitionen der US-Bundesstaaten und Territorien
- Vitalnet Data Scenarios
Ein „Datenszenario“ von Vitalnet ist eine vollständige Datenanalysesituation
- Genomic Data Commons (GDC)
Repository und Rechenplattform für Krebsforscher, die sich mit Krebs, seinem klinischen Verlauf und dem Ansprechen auf Therapien befasst
- Gapminder
Vollständige Datensätze mit Hunderten von Indikatoren
- Medical Subject Headings
Der Thesaurus „Medical Subject Headings“ (MeSH) ist ein kontrolliertes und hierarchisch gegliedertes Vokabular, das von der National Library of Medicine erstellt wurde
- MeDAL dataset
Medical Abbreviation Disambiguation Dataset for Natural Language Understanding Pretraining (MeDAL)
- Medicare Coverage Database (MCD)
Verfahren und Zeitpläne zur Feststellung des Versicherungsschutzes
- data.cms.gov
Daten des Centers for Medicare & Medicaid Services Data (CMS)
- Nightingale Open Science
Datensätze zu Herzinfarkt, Krebsmetastasen, Herzstillstand, Knochenalterung, Covid-19
- Ebola Cases and Deaths in Affected Countries
Gesamtzahl der wahrscheinlichen, bestätigten und vermuteten Ebola-Fälle und Todesfälle in Guinea, Liberia, Sierra Leone, Nigeria, Senegal, Mali, Spanien, den USA, Großbritannien und Italien
- Organisation Data Service (ODS)
Datenservice des National Health Service (NHS) in England
- OpenPaymentsData.CMS.gov
Zahlungen an Krankenhäuser und Gesundheitsdienstleister von medizinischen Unternehmen
- PhysioNet
Datenbanken von PhysioNet
- Spanish Flu Dataset
Sterblichkeit infolge der Grippepandemie von 1918, Chicago, USA
- Cancer Imaging Archive
Das Cancer Imaging Archive (TCIA) ist ein Dienst, der ein umfangreiches Archiv medizinischer Krebsbilder anonymisiert und bereitstellt
- US Water Quality Data by ZIP Code
Tägliche Daten zur Wasserqualität in den USA nach Postleitzahl – Verstöße gegen EPA-Vorschriften, Bleigehalte, Sicherheitsbewertungen
- The Global Health Observatory
Das GHO-Datenarchiv ist das Portal der WHO für gesundheitsbezogene Statistiken ihrer 194 Mitgliedstaaten
- Informatics for Integrating Biology & the Bedside (i2b2)
NLP-Forschungsdatensätze
Klima und Wetter¶
- 38-Cloud: A Cloud Segmentation Dataset
38 Landsat-8-Bilder sowie die manuell extrahierten Referenzwerte auf Pixelebene für die Wolkenerkennung
- Aviation Weather Center
Warnungen, Vorhersagen und Analysen zu gefährlichen Wetterlagen für die Luftfahrt
- Actuaries Climate Index
Monatliche und saisonale Daten nach Region und Komponente
- Average city temperatures
Tägliche Daten zu den durchschnittlichen Lufttemperaturen in Großstädten weltweit
- Canadian Weather Information
Historische Daten nach Stationsname, Provinz, Territorium oder nach Entfernung
- Caravan
Globaler Datensatz für die Hydrologie mit großen Stichproben
- CDC – Climate Data Center
Klimadaten des Deutschen Wetterdienstes (DWD)
- Climate Data Online (CDO)
Statistiken, aktuelle Wetterbeobachtungen und Klimadaten aus dem Australian Data Archive for Meteorology (ADAM)
- Climatic Research Unit
Von der CRU des National Centre for Atmospheric Science (NCAS) bereitgestellte Daten
- Copernicus Climate Change Service (C3S)
Einer der sechs thematischen Dienste, die im Rahmen des Copernicus-Programms der Europäischen Union bereitgestellt werden
- European Climate Assessment & Dataset (ECA&D)
Datensätze über Veränderungen bei Wetter- und Klimaextremen
- GDELT Project: Four Massive Datasets Charting The Global Climate Change News Narrative 2009-2020
Vier umfangreiche Datensätze zur Darstellung der Berichterstattung über den globalen Klimawandel 2009–2020
- NOAA Global Radiation and Aerosols (GRAD) Data
Langzeitmessungen der Strahlung, meteorologischer Parameter und Aerosole an verschiedenen abgelegenen Standorten weltweit sowie an Standorten auf dem amerikanischen Kontinent
- NOAA Local Climatological Data (LCD)
Zusammenfassungen der klimatologischen Bedingungen von Flughäfen und anderen bedeutenden Wetterstationen
- Open-Meteo
Offene Daten mit einer hohen Auflösung von 1 bis 11 Kilometern
- WorldClim
Karten, Grafiken, Tabellen und Daten zum globalen Klima
Komplexes Netzwerk¶
- Archive-IT
Archivierte Websites und Webseiten
- CRAWDAD
„Community Resource for Archiving Wireless Data at Dartmouth“ (CRAWDAD)
- DIMACS
Benchmarks für Generatoren synthetischer und realer Eingaben, Kurzstreckenberechner und Skripte zur Erstellung von Benchmark-Leistungsberichten sowie eine ausführliche Dokumentation
- DOI URLs
DOIs von knapp 50 Millionen Zeitschriftenartikeln vom OAI-PMH-Server
- Internet Archive Dataset Collection
Umfangreiche Datenarchive sowohl von Institutionen als auch von Einzelpersonen
- KONECT
Netzwerkdatensätze aus der Koblenz Network Collection
- Laboratory for Web Algorithmics
Daten für das WebGraph-Framework
- Mark Newman: Network data
Links zu Netzwerkdatensätzen im GML-Format
- Microsoft Research Tools: code, datasets, & models
Verzeichnis von Datensätzen, SDKs, APIs und Open-Source-Tools, die von Microsoft-Forschern entwickelt wurden
- NBER U.S. Patent Citations Data File
Erkenntnisse, Einsichten und methodische Instrumente
- Network Repository
Interaktives Daten- und Netzwerkdaten-Repository mit visueller Echtzeit-Analyse mit Tausenden von Datensätzen aus über 30 Fachgebieten von biologischen bis hin zu sozialen Netzwerkdaten
- NIST Complex Network Resources
Standarddatensätze, anhand dessen Algorithmen und Behauptungen verglichen und überprüft werden können
- The R Datasets Package
Das R-Paket
datasets- PyPi/Maven dependency data
Drei LZMA-komprimierte Dateien: mvn-deps.csv.lzma, mvn-minimal-deps.csv.lzma und pypi-deps.csv.lzma
- Scopus
Datenbank für Abstracts und Zitate
- Stack Overflow Annual Developer Survey
Jährliche Entwicklerumfrage von Stack Overflow
- Stanford GraphBase
Literate Programming mit mehr als 30 Beispielen
- Stanford Large Network Dataset Collection
Sammlung des Stanford Network Analysis Project, u.a. zu sozialen Netzwerken, Zitations- und Kooperationsnetzwerke, Straßennetze und Wikipedia-Netzwerke
- SuiteSparse Matrix Collection
Sammlung dünnbesetzter Matrizen
- UCI Network Data Repository
Datensätze des UCI Network Data Repository, u.a. Sammlungen klassischer Netzwerkdatensätze und von Forschungsgruppen oder Organisationen kuratierte Datensätze
Medizin¶
- BCNB
WSI-Datensatz zur Kernnadelbiopsie bei Brustkrebs im Frühstadium
- Broad Bioimage Benchmark Collection
Die Broad Bioimage Benchmark Collection (BBBC) ist eine Sammlung von Mikroskopiebildersätzen. Neben Bildern enthält jeder Satz eine Beschreibung der biologischen Anwendung sowie erwartete Ergebnisse
- Catalogue Of Semantic Mutations In Cancer (COSMIC)
Daten von COSMIC, Cell Lines Project, Actionability und Cancer Mutation Census (CMC)
- CCLE Cancer Cell Line Encyclopedia
Krebszelllinien-Modelle zur Erforschung der Krebsbiologie, zur Validierung von Krebs-Targets und zur Bestimmung der Wirksamkeit von Medikamenten
- Genomics of Drug Sensitivity in Cancer datasets
Datensätze und Merkmale zur Genomik der Arzneimittelempfindlichkeit bei Krebserkrankungen
- Grand Challenge
Plattform für maschinelles Lernen in der medizinischen Bildgebung
- HMS LINCS Project
Das LINCS-Projekt sammelt und verbreitet Daten und Analysewerkzeuge, um zu verstehen, wie menschliche Zellen auf Störungen durch Medikamente, die Umwelt und Mutationen reagieren.
- Serratus
Kollaboratives Open-Science-Projekt zur Erkennung von Viren
- Stowers Original Data Repository
Die den wissenschaftlichen Publikationen zugrunde liegenden Daten des Stowers Institute for Medical Research
Natürliche Sprache¶
- Automatic Keyphrase Extraction
Datensätze für die automatische Extraktion von Schlüsselbegriffen
- The Big Bad NLP database
Mehr als 400 gut strukturierten NLP-Datensätzen für gängige NLP-Aufgaben und -Anforderungen, wie Dokumentenklassifizierung, automatische Bildbeschriftung, Dialoge, Clustering, Intent-Klassifizierung, Sprachmodellierung, maschinelle Übersetzung, Textkorpora und vieles mehr
- Blizzard Challenge 2018
Ca. 6,5 Stunden Sprachdaten in britischem Englisch von einer einzigen Sprecherin
- The Blog Authorship Corpus
Beiträge von 19.320 Bloggern, die im August 2004 von blogger.com gesammelt wurden
- CLiPS Stylometry Investigation (CSI) Corpus
Jährlich erweiterter Korpus von studentischen Aufsätzen und Rezensionen
- DBpedia
Aktuelle Veröffentlichungen der Kerndaten von en.wikipedia.org
- List of Dirty, Naughty, Obscene, and Otherwise Bad Words
Filter für Shutterstocks Autovervollständigungsserver und Empfehlungsmaschine
- European Parliament Proceedings Parallel Corpus 1996-2011
Ein Parallelkorpus für die statistische maschinelle Übersetzung
- Explanation Bank
Inferenzalgorithmen, die komplexe Fragen beantworten und für Menschen verständliche Erklärungen liefern
- German Political Speeches Corpus and Visualization
Politische Reden deutscher Spitzenpolitiker, die überwiegend ab 1990 gehalten wurden
- Google Books Ngram Viewer Datasets
Der Google Books Ngram Viewer ist für die schnelle Abfrage der Verwendung kleinerer Wortgruppen optimiert
- Gutenberg Offline Catalogs
eBooks von Project Gutenberg
- The LJ Speech Dataset
Gemeinfreier Sprachdatensatz, der aus 13.100 kurzen Audioclips besteht
- Making Sense of Microposts (#Microposts2016)
Tweets des Redites-Projekt, die zahlreiche bemerkenswerte Ereignisse aus den Jahren 2011 und 2013 abdecken
- MC-AFP
Datensatz zu Machine Comprehension auf der Grundlage des Gigaword-Datensatzes
- Machine Comprehension Test (MCTest)
Sammlung von 660 Geschichten und dazugehörigen Fragen
- MS MARCO
Datensätze zur Generierung natürlicher Sprache, zur Rangfolge von Textpassagen, zur Extraktion von Schlüsselbegriffen, zur dialogorientierten Suche und einen Crawling-Datensatz
- Multi-Domain Sentiment Dataset
Produktbewertungen von Amazon.com aus vielen verschiedenen Produktkategorien (Domänen)
- No Language Left Behind (NLLB - 200vo)
Datensatz auf der Grundlage von Metadaten für von Meta AI veröffentlichten, extrahierte Bitexten
- Noisy speech database for training speech enhancement algorithms and TTS models
Datenbank mit klarer und verrauschter Parallelsprache
- Personae Corpus
Das „Personae“-Korpus wurde für Experimente zur Urheberschaftszuschreibung und Persönlichkeitsvorhersage zusammengestellt
- SMS Spam Collection
Der Korpus wurde aus freien oder für Forschungszwecke frei zugänglichen Quellen im Internet zusammengestellt
- SQuAD2.0 – The Stanford Question Answering Dataset
SQuAD 2.0 testet die Fähigkeit eines Systems, nicht nur Fragen zum Leseverständnis zu beantworten, sondern auch keine Antwort zu geben, wenn eine Frage nicht beantwortet werden kann
- Universal Dependencies
Framework für die konsistente Annotation von Grammatik (Wortarten, morphologische Merkmale und syntaktische Abhängigkeiten) in verschiedenen menschlichen Sprachen
- USENET corpus
Sammlung öffentlicher USENET-Beiträge zwischen Oktober 2005 und Januar 2011
- Web 1T 5-gram Version 1
Die N-Gram-Häufigkeiten wurden aus Texten generiert, die von öffentlich zugänglichen Webseiten stammen
- Wikidata
Wikidata Datenbank-Dumps
- Wordbank
Eine offene Datenbank zur Wortschatzentwicklung von Kindern
- WordNet – A Lexical Database for English wndb(5WN)
Umfangreiche lexikalische Datenbank der englischen Sprache. Substantive, Verben, Adjektive und Adverbien sind in Gruppen kognitiver Synonyme (Synsets) zusammengefasst
Neurowissenschaften¶
- Allen Institute Brain Knowledge Platform
Datenkatalog der Brain Knowledge Platform bietet Zugang zu einer Vielzahl von Projekten und Datensammlungen
- BrainOmics Neuroimaging Genetics
Zusammenhänge zwischen Neuroimaging, Genetik und kognitiven Daten
- codeneuro neurofinder
Jeder Datensatz ist als ZIP-Datei verfügbar und enthält Bilder, Referenz-Neuronregionen, Metadaten sowie Code zum Laden der Daten
- CRCNS - Collaborative Research in Computational Neuroscience
Daten aus der ersten Runde der Datenaustauschprojekte bereitgestellt, die im Rahmen des CRCNS-Förderprogramms unterstützt wurden
- Child Mind Institute
International Neuroimaging Data-Sharing Initiative (INDI)
- Human Connectome Project (HCP) Young Adult
Studiendaten des HCP Young Adult (HCP-YA)-Projekts
- National Database for Autism Research (NDAR)
Daten zu Autismus-Spektrum-Störungen auf allen Ebenen der biologischen und verhaltensbezogenen Organisation
- NIMH Data Archive
Datenarchiv des National Institute of Mental Health (NDA)
- NeuroElectro
Elektrophysiologische Eigenschaften, z. B. Ruhemembranpotenziale und Membranzeitkonstanten, verschiedener Neuronentypen
- NeuroMorpho.Org
Sammlung digital rekonstruierter Neuronen und Gliazellen
- Open Access Series of Imaging Studies (OASIS)
Datensätze aus der Neurobildgebung des Gehirns
- Open NeuroData Registry
Zahlreiche Neuroimaging-Datensätze (als vorab berechnete Neuroglancer-Volumen) aus verschiedenen Modalitäten und Maßstäben
- OpenfMRI
Archiv für Bildgebungsdaten des menschlichen Gehirns, die mittels MRT- und EEG-Verfahren erhoben wurden
- OpenNeuro
Plattform zur Validierung und zum Austausch von BIDS-konformen MRT-, PET-, MEG-, EEG- und iEEG-Daten
- StudyForrest
Daten zur Gehirnstruktur, zur Gehirnfunktion und zu den Eigenschaften der Filmstimuli
- GigaDB
2669 auffindbare, nachverfolgbare und zitierfähige Datensätze
Physik¶
- CERN Open Data portal
Archivierte Ergebnisse verschiedener Forschungsaktivitäten und dazugehörige Software sowie Dokumentation
- IceCube Neutrino Observatory
IceCube-Neutrino-Punktquellendaten in Richtung von TXS 0506+056
- Gravitational Wave Open Science Center (GWOSC)
Daten von Gravitationswellenobservatorien
- NASA Exoplanet Archive
Planetenparameter für bestätigte Planeten
- Entry Points to NASA Science Data
Themenbezogene Archive über Sterne, Planeten und andere Himmelskörper, die Sonne, unsere Erde und Zellen
- Quantum simulations of an electron in a two dimensional potential well
Numerische Simulation eines Elektrons in einem zweidimensionalen Einschlusspotential
- Sloan Digital Sky Survey (SDSS)
Kartierung des nahen und fernen Universums, um die physikalischen Prozesse zu ergründen, die unser Universum bestimmen
Regierungsinformationen¶
- Datos Argentina
Datenrepository der Argentinischen Nation
- Australian Bureu of Statistics
Australiens nationales Statistikamt
- Data.gov.au
Offene Regierungsdaten in Australien
- data.gv.at
Zentraler Katalog mit Metadaten der dezentralen Datenkataloge österreichischer Verwaltungen
- Data.Gov.be
Das belgische Datenportal
- dados.gov.br
Brasilianisches Open Data Portal
- GovData
Datenportal für Deutschland mit Gesetzestexten, Studien und Leitfäden zu „Open Government“
- open.canada.ca
„Open Government“ der kanadischen Regierung
- datos.gob.cl
Datensätze öffentlicher Institutionen in Chile
- EU Open Data Portal
Das offizielle Portal für europäische Daten
- Metadaten Verbund (MetaVer)
Gemeinsames Portal der Bundesländer Brandenburg, Bremen, Hamburg, Hessen, Mecklenburg-Vorpommern, Saarland, Sachsen und Sachsen-Anhalt
- National Bureau of Statistics of China (NBS)
Offene Daten des chinesischen Statistikamtes
- Debt to the Penny
Informationen des US-Finanzministeriums über die gesamte ausstehende Staatsverschuldung
- National Archives
Die National Archives and Records Administration (NARA) archiviert Dokumente und Materialien, die im Rahmen der Tätigkeit der US-Bundesregierung entstehen
- Eurostat
Statistiken und Daten zu Europa
- EveryPolitician
Weltweite Datenbank von OpenSanctions mit politischen Amtsträgern
- StatsPolicy|gov
Dezentrales Netzwerk des US-Bundesstatistiksystem
- Finnish open data
Finnisches Open-Data-Portal
- data.gouv
Plattform für französische offene Daten
- GENESIS-Online
Datenbank des deutschen Statistischen Bundesamtes
- data.gov.gr
Griechisches Register für offene Daten des öffentlichen Sektors
- Open Government Data (OGD) Platform India
Portal für offene Regierungsdaten des National Informatics Centre (NIC) der indischen Regierung
- data.go.id
Dateninformationen und öffentliche offizielle Informationen der indonesischen Regierung
- data.gov.ie
Irlands Open-Data-Portal
- data.gov.il
Datenbanken aller israelischen Ministerien
- dati.gov.it
Offene Daten der italienischen öffentlichen Verwaltung
- e-Stat Portal Site of Official Statistics of Japan
Portal für japanische Regierungsstatistiken
- data.public.lu
Luxemburgische Open-Data-Plattform
- data.gov.my
Malaysias offizielles Open-Data-Portal
- datos.gob.mx
Nationale mexikanische Plattform für offene Daten
- date.gov.md
Datenportal der moldavischen Regierung
- data.overheid.nl
Datenregister der niederländischen Regierung
- stats.govt.nz
Statistiken der offiziellen Statistikbehörde Neuseelands Stats NZ (Tatauranga Aotearoa)
- OECD Data
Daten der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung
- Open Data Hub
Open-Data-Katalog mit Schwerpunkt auf Mobilität und Tourismus
- pordata.pt
PORDATA wurde von der Francisco-Manuel-dos-Santos-Stiftung organisiert und entwickelt
- data.gov.ro
Offene Datensätze Rumäniens, die von Behörden und Institutionen bereitgestellt werden
- data.gov.ru
Offenes Datenregister Russlands
- Singapore’s open data portal
Singapurs Open-Data-Portal
- stats sa
Statistiken der Republik Südafrika
- opendata.swiss
Schweizer Open Government Data
- data.gov.tw
Taiwanesische Open Government Data
- Tunisia Data Portal
Datenportal Tunesiens
- data.gov.uk directory
Daten, der Zentralregierung, den Kommunalbehörden und öffentlichen Einrichtungen des Vereinigten Königreichs
- Geographic Data Service
UK Research and Innovation (UKRI) Smart Data Research (SDR UK)
- Healthy and Sustainable Places (HASP) Data Service
Smarte Daten für ein besseres Verständnis der Lebensqualität und Nachhaltigkeit von Orten
- United States Census Bureau
Daten des statistischen Amtes der Vereinigten Staaten
- National Center for Health Statistics (CDC)
Daten- und Analysewerkzeuge des Nationalen Zentrums für Gesundheitsstatistik
- U.S. Department of Housing and Urban Development’s Office of Policy Development and Research (PD&R)
Forschungsergebnisse, Publikationen und Datensätze zu den Themen Wohnungswesen, Gemeindeentwicklung und weiteren Bereichen der Vereinigten Staaten
- data.gov
Daten, Tools und Ressourcen der US-Regierung
- OpenFDA
Daten der Food and Drug Administration (FDA) des US-Gesundheitsministeriums
- National Center for Education Statistics (NCES)
Daten der Lage des Bildungswesens in den Vereinigten Staaten
- United States Patent and Trademark Office (USPTO)
die Datenplattform des USPTO
- Congressional Research Service
Berichte des Thinktanks des Kongresses
- Uganda Bureau of Statistics
Datenportale des statistischen Amtes von Uganda
- data.gov.ua
Datenportal der Ukraine
- catalogodatos.gub.uy
Offene Daten Uruguays
- IATI Country Development Finance Data
Daten zu Entwicklungs- und humanitären Aktivitäten, nach Land, berichtender Organisation und Sektor
- UNdata
Ressourcen vom Statistiksystem der Vereinten Nationen (UN) und anderen internationalen Organisationen
- UNESCO Datahub
Daten aus Initiativen der UNESCO in den Bereichen Bildung, Wissenschaft, Kultur und Kommunikation
- UNICEF Data and Analytics
Daten zur Situation von Kindern und Frauen weltweit
- World Bank Open Data
Open-Data-Plattform der Weltbank
Suchmaschinen¶
- Academic Torrents
Skalierbare BitTorrent-Infrastruktur
- Data Basis
Nichtregierungsorganisation, die die größte öffentliche Datenplattform Brasiliens betreibt
- Data Commons
Data Commons ist eine Initiative von Google, um mit einem einheitlichen Knowledge Graph vielfältige, standardisierte Daten erkunden zu können
- DataHub Collections
Kuratierte Datensätze
- Domains Project
World’s Single Largest Internet Domains Dataset
- ERIC - Education Resources Information Center
Internetbasierte Datenbank mit Literaturangaben und Volltexten aus dem Bereich der Bildungsforschung und -information
- Galaxy Europe
Tausende von Tools, Kontingente sowie Recheninfrastruktur im Rahmen von „Training Infrastructure as a Service“ (TIaaS)
- Google Dataset Search
Name, Beschreibung, Urheber und Veröffentlichungsformate von Datensätzen
- Harvard Dataverse
Repository für Forschungsdaten und Code
- ICPSR
Bibliografie, Variablensuche und thematische Sammlung des Inter-university Consortium for Political and Social Research (ICPSR)
- Kaggle Datasets
Kaggle unterstützt eine Vielzahl von Formaten für die Veröffentlichung von Datensätzen
- National Technical Reports Library (NTRL)
Sammlung von technischen Berichten, die von der US-Regierung gefördert wurden
- NFDI4DS Portal
Forschungsdaten des NFDI4DataScience (NFDI4DS)-Konsortiums
- ODI Certified Datasets
Vom Open Data Institute (ODI) zertifizierte Datensätze
- Open Data Inception
Open-Data-Portale weltweit
- PaN-Finder
Aufbauend auf dem PaNOSC-Projekt werden Datenkataloge großer Forschungseinrichtungen miteinander vernetzt.
- Registry of research data repositories (re3data)
Weltweites Verzeichnis von Forschungsdatenarchiven aller Forschungsdisziplinen
- Statista
Portal für Marktdaten, Marktforschung und Marktstudien
- Zenodo
Repository für von der EU-Kommission finanzierte Forschungsergebnisse des OpenAIRE-Projekts
Sozialwissenschaften¶
- ACLED
ACLED ist eine unabhängige, unparteiische Konfliktbeobachtungsstelle, die Echtzeitdaten und Analysen zu gewalttätigen Konflikten und Protesten in allen Ländern und Gebieten weltweit bereitstellt
- ARED
ARED ist eine Sammlung biografischer und beruflicher Informationen über Personen, die die oberste Elite autoritärer Regime bilden
- CanLII
Kanadisches Institut für Rechtsinformationen
- CEWS
Statistische Daten zu Geschlechterverhältnissen in der Wissenschaft
- COW
COW fördert die Erhebung, Verbreitung und Nutzung präziser und zuverlässiger quantitativer Daten im Bereich internationaler Beziehungen
- Cryptome
Cryptome veröffentlicht offene, geheime und als geheim eingestufte Dokumente
- data.police.uk
Informationen zu Straftaten, Ermittlungsergebnissen sowie Personenkontrollen und Durchsuchungen auf Straßenebene, aufgeschlüsselt nach Polizeibezirken
- Employment Research Data Center
Daten aus zahlreichen Forschungs- und Evaluierungsprojekten des Upjohn Institute, die vom US-Arbeitsministerium gefördert werden
- ESS Data Portal
ESS ist eine wissenschaftlich orientierte länderübergreifende Erhebung
- FBI Hate Crimes Report 2013
Aggregierte Daten aus allen US-Bundesstaaten
- Fragile States Index
Der Fund for Peace (FFP) erstellt den Fragile States Index, eine Rangliste von 178 Ländern, die anhand von 12 Indikatoren die Risiken und Anfälligkeiten der einzelnen Staaten bewertet
- GDELT Project
Der Global Knowledge Graph verbindet Menschen, Organisationen, Orte, Themen, Zahlen, Bilder und Emotionen zu einem einzigen Netzwerk über den gesamten Planeten
- Global Religious Futures Project
Religiöser Wandel und dessen Auswirkungen auf Gesellschaften weltweit
- GSS
Die Daten der GDD enthalten Haustiere, Kreditgeschichte, sozialen Netzwerke, Bedeutung kultureller Werte sowie Merkmale und Beobachtungen der Interviewer
- Gun Violence Data
Datenbank, die Aufzeichnungen zu über 260.000 Vorfällen von Waffengewalt in den USA von Januar 2013 bis März 2018 enthält
- Humanitarian Data Exchange
HDX ist eine offene Plattform für den Datenaustausch zwischen verschiedenen Krisen und Organisationen
- IDB Open Data
Daten zur wirtschaftlichen und sozialen Entwicklung in Lateinamerika und der Karibik der IDB
- INED surveys and data
Online-Katalog der Erhebungen und Daten des französischen Instituts für demografische Studien (INED)
- INFORM Severity Index
INFORM ist eine Zusammenarbeit zwischen der Referenzgruppe für Risiken, Frühwarnung und Vorsorge des Ständigen Interinstitutionellen Ausschusses und der Europäischen Kommission
- INSCR
INSCR wurde gegründet, um die vom Center for Systemic Peace erstellten und genutzten Informationsressourcen zu koordinieren und zu bündeln
- Integrated Civil Society Organizations System
Das iCSO-System erleichtert die Zusammenarbeit zwischen zivilgesellschaftlichen Organisationen und der DESA
- International Networks Archive (INA)
Das INA sammelt umfangreiche aktuelle und historische Daten, u. a. zu Waffen, Büchern, Kapitalströmen
- International Social Survey Programme
Das ISSP ist ein länderübergreifendes Kooperationsprogramm, das jährlich Umfragen zu verschiedenen sozialwissenschaftlich relevanten Themen durchführt
- IPUMS
IPUMS stellt Volkszählungs- und Erhebungsdaten aus aller Welt bereit, die zeitlich und räumlich miteinander verknüpft sind
- Mass Mobilization Protest Data
Proteste gegen Regierungen in allen Ländern, 1990–2020
- Microsoft Academic Graph
Der Microsoft Academic Graph ist ein heterogener Graph, der Datensätze zu wissenschaftlichen Publikationen, Zitationsbeziehungen zwischen diesen Publikationen sowie Autoren, Institutionen, Zeitschriften, Konferenzen und Fachgebiete umfasst
- ND-GAIN
Der ND-GAIN ist ein Messinstrument, das Regierungen, Unternehmen und Gemeinden dabei unterstützt, durch den Klimawandel verschärfte Risiken wie Überbevölkerung, Ernährungsunsicherheit, unzureichende Infrastruktur und zivile Konflikte zu untersuchen
- OpenSanctions
OpenSanctions ist eine internationale Datenbank mit Personen und Unternehmen, die von politischem, strafrechtlichem oder wirtschaftlichem Interesse sind
- Our World in Data
„Our World in Data“ konzentriert sich auf große und beängstigende Probleme der Welt: Armut, Krankheit, Hunger, Klimawandel, Krieg, existenzielle Risiken und Ungleichheit
- Oxford Research Encyclopedia of International Studies
Die „Encyclopedia of International Studies“ ist nun zusammen mit neuen und überarbeiteten Artikeln als „Oxford Research Encyclopedia (ORE) of International Studies“ verfügbar
- Reality Commons
Möglichkeiten von Smartphones menschliche Interaktionen über die traditionellen, auf Umfragen oder Simulationen basierenden Methoden hinaus zu erforschen
- Stack Exchange Data Explorer
Open-Source-Tool zur Durchführung beliebiger Abfragen auf öffentliche Daten aus dem Stack Exchange-Netzwerk
- Titanic Dataset
Datensatz zu Vorhersagen über Überlebende der Titanic
- UC DATA
Archiv der UC Berkeley für digitalisierte sozialwissenschaftliche Daten und Statistiken
- UCLA Social Science Data Archive
Das „Social Science Data Archive“ ist seit 1961 an der UCLA tätig
- Uppsala Conflict Data Program
UCDP des Department of Peace and Conflict Research bietet Daten zu organisierter Gewalt
- World Inequality Database
Die World Inequality Database (WID) bietet eine Datenbank über die historische Entwicklung der weltweiten Einkommens- und Vermögensverteilung sowohl innerhalb einzelner Länder als auch zwischen Ländern
- WorldPop
Bevölkerungsdaten auf lokaler Ebene einschließlich der Erfassung der Fortschritte bei der Erreichung der Ziele für nachhaltige Entwicklung
- Joshua Project
Daten für einen bestimmten Kontinent, eine Region, ein Land, eine Religion, einen Affinitätsblock, eine Bevölkerungsgruppe
Transport und Verkehr¶
- Autobahn App API
API für aktuelle Verwaltungsdaten zu Baustellen, Staus und Ladestationen
- Aviation accident database
Alle Unfälle in der zivilen und gewerblichen Luftfahrt mit Passagierflugzeugen im Linien- und Nichtlinienverkehr weltweit
- BASt Datensammlungen
Daten zu Brücken- und Ingenieurbau, Straßenbau, Verhalten und Sicherheit und Verkehrstechnik der Bundesanstalt für Straßen- und Verkehrswesen (BASt)
- Bike Share Data Systems
Datenportale für Fahrradverleihsysteme
- BIXI Open data
Mitglieder vs. Gelegenheitsnutzer, Reiseverlauf und Stationsstatus
- Chicago Metropolitan Agency for Planning: Transportation Data
Verkehrsprognosen der CMAP, gestützt auf ein umfangreiches regionales Modellierungssystem
- Czech National Traffic Information Registry
Überblick über Verkehrsinformationsquellen und deren Anbieter, einschließlich einer technischen Beschreibung der Formate und Protokolle
- Darmstadt Mobilität
Mobilitätsdaten von Darmstadt
- Data Expo 2009: Airline on time data
Ankunfts- und Abflugdetails für kommerzielle Flüge innerhalb der USA von Oktober 1987 bis April 2008
- data.europa.eu: Transport
Transportdatensätze der EU
- DB AG APIs und Datenströme
OpenAPI, AsyncAPI, RIS-API und GTFS, GTFS-RT, RiFahrt
- Datastore.brussels: Transport
Verkehrsdatensätze aus Brüssel
- Düsseldorf Verkehrsmeldungen – Mobilitätsdaten
Verkehrsmeldungen und Geodaten der Stadt Düsseldorf
- England National Highways
Aktuelle Verkehrsinformationen des National Traffic Information Service
- Fatality Analysis Reporting System (FARS)
FARS-Meldungen von tödlichen Unfällen
- Finish Transport Infrastructure Agency
Offene Daten der finnischen Verkehrsbehörde
- Fintraffic Data sources
Verkehrsinformationen aus den Verkehrsmanagementsystemen von ITM Finland Ltd.
- Freight Analysis Framework Data
Güterverkehrsanalyse des BTS und der FHWA
- gencat.cat
Mobilitäts- und Verkehrsdaten Katalaniens
- GeoLife GPS Trajectories
GPS-Bewegungsdaten im Rahmen des Geolife-Projekts (Microsoft Research Asia) von 182 Nutzern von April 2007 bis August 2012
- Jena Open Data: Mobilität
Parken, Verkehrsbehinderungen, touristische Radwege, Straßenbaumaßnahmen etc.
- Köln: Transport und Verkehr
Transport- und Verkehrsaten der Stadt Köln
- Transport for London
Liste der verfügbaren TfL-Datenfeeds
- MobiData BW
Mobilitätsdaten der Nahverkehrsgesellschaft Baden-Württemberg
- Mobilithek
Plattform zum Austausch digitaler Informationen von Mobilitätsanbietern, Infrastrukturbetreibern und Verkehrsbehörden sowie Informationsanbietern
- NDW Open Data
Niederländische Mobilitätsdaten
- Open Data im Tourismus
Knowledge Graphen zu den Domains Sehenswürdigkeiten, Veranstaltungen, Touren, Beherbergungsbetriebe und Restaurants
- Open.NRW: Verkehr
Verkehrsdatensätze des Landes Nordrhein-Westfalen
- OpenFlights Airports Database
Die Basisdaten zu den Flughäfen stammen aus DAFIF und OurAirports
- OpenStation
Zentrale Datenquelle von DB InfraGO für offene Daten zur Infrastruktur von Personenbahnhöfen in Deutschland
- Paris Data Comptage routier
Straßenzählung – Verkehrsdaten von permanenten Sensoren
- Pedestrian Counting System
Stündliche Fußgängerzahlen seit 2009, die von Fußgängersensoren in Melbourne erfasst wurden
- renfe Data
Daten der spanischen Eisenbahnen
- Schweizer Bundesamt für Strassen ASTRA
Verkehrsdaten des ASTRA
- Traffic Scotland Data Hub
Verkehrs- und Reiseinformationen von Traffic Scotland
- SF Bay Area Bike Share
Das Unternehmen Bay Area Bike Share veröffentlicht regelmäßig offene Daten
- Tark Tee Smart Road DATEX II data gateway
Verkehrs- und straßenbezogene Informationen der estnischen Verkehrsbehörde in DATEX II-Format
- TLC Trip Record Data
Fahrtenaufzeichnungen für gelbe und grüne Taxis der New York City Taxi and Limousine Commission (TLC)
- Toronto’s Open Data: Transportation
Transportdatensätze von Toronto
- Uber TLC FOIL Response
Uber-Fahrdaten, die im Rahmen eines Antrags auf Informationsfreiheit bei der New Yorker Taxi & Limousine Commission angefordert wurden
- UK National Highways
Daten der Highways Agency zu Fahrzeiten und Verkehrsfluss im Straßennetz
- US Bureau of Transportation Statistics
Datenbanken des BTS
- US domestic flights from 1990 to 2009
US-Inlandsflüge von 1990 bis 2009
- US Traffic Volume Trends
Monatlicher Bericht, der auf stündlichen Verkehrszähldaten basiert, die von den US-Bundesstaaten gemeldet werden
- Vlaams Verkeerscentrum
Daten des flämischen Verkehrszentrum Verkehrsnachfrage und eine groß angelegte Verkehrserhebung