Portail:Données

correlogramme Portail de la Datascience et de la donnée
Data science.png

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data et de la DataViz (Data visualisation)

164 articles sont actuellement liés au portail


Outils informatique

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflow

Jeux de données : Iris (jeu de données)

Logiciels : TanagraRStudioSASSPSSOrangeH2O.ai

Bases de données : MongoDBCassandraCouchDBHBase

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAIApache Airflow

Théorie & Concepts

Science des données

Dilemme biais-varianceBon article DataminingSurapprentissageDonnées non structurées

NoSQLNewSQLTraitement analytique en ligne

Big DataLac de donnéesJeu de données

Divers nettoyage des données : Flexion (linguistique)Lexème (linguistique)Nettoyage de données

DataViz

Type de représentation : DendrogrammeNuage de mots-clésNuage de pointsCorrélogramme

Logiciels : Business ObjectsTableau SoftwareQlik

Articles connexes : Carte heuristique

Sources de données


Open data

Généralistes

INSEEPortail des données ouvertes de l'Union européennedata.gouv.frOpen data en FranceAPIDivers jeux de données AWSBase de données MNISTFashion MNIST (Jeu de données)image-net.orgPortail des données ouvertes de l'Union européenne

Spécialisées

OpenStreetMapOpen Food Facts


Petit monde Wikipédia

Palettes & barres : Modèle:Palette DatascienceModèle:Palette Big dataModèle:Palette StatisticiensModèle:Palette Apprentissage automatiqueModèle:Palette DeepLearning

Catégories : Catégorie:Science des donnéesCatégorie:Écosystème HadoopCatégorie:Exploration de données

Boîtes : Modèle:Utilisateur Datascientist

Liste des modifications des articles liées au portail


Articles à créer  : Apache beeline, Apache SAMOA

Articles à traduire :

Articles à relire, améliorer, modifier : Hadoop, Iris (jeu de données),Apache Beam, Apache Phoenix‎(quelques sections à traduire),Liste des projets autour du big data,Apache Tez,Apache Parquet

Ailleurs que sur Wikipédia

Autres projets:

Wikibook : Programmation statistiques avec RDécouvrir ScilabApprendre à programmer avec Python

Wikiquote : Big data

Wiktionnaire : Big dataDatamining


Littérature Auteurs : Stéphane Tufféry

Internet : wikistat.frhttp://www.jybaudot.fr/General/indexstats.htmlhttp://factominer.free.fr/classical-methods/index_fr.html

Médias utilisés sur cette page

Logo proba 4.svg
Auteur/Créateur: Ipipipourax, Licence: CC BY-SA 3.0
different logo for proba/stat
Gear icon.svg
Auteur/Créateur: MGalloway (WMF), Licence: CC BY-SA 3.0
Gear icon
GNOME Builder icon symbolic.svg
Auteur/Créateur: Jakub Steiner? Christian Hergert?, Licence: GPL
Program icon for the integrated development environment GNOME Builder from the GNOME Symbolic Icons set
CarMilageData.png
Auteur/Créateur: Jackverr, Licence: CC BY-SA 3.0
A correlogram plotted with R data
Nuvola apps kchart.svg
Auteur/Créateur: en:David Vignoni, User:Stannered, Licence: LGPL
Icon for Nuvola icon theme for KDE 3.x.
Computer lab icon.svg
Auteur/Créateur: PanierAvide, Licence: CC BY-SA 4.0
A SVG icon for computer laboratories/rooms
Wikify.png
Selo de wikificação
Math.svg
Icon containing numerous mathematical symbols.
Nuvola mimetypes binary.png
Auteur/Créateur: David Vignoni / ICON KING, Licence: LGPL
Icône du thème d'icônes Nuvola pour KDE 3.x.
Data science.png
Auteur/Créateur: Hckum, Licence: CC BY-SA 4.0
Data Science. Adapted from the Data Science venn diagram (cite: NIST big data workgroup)
Web browser icon symbolic.svg
Auteur/Créateur: Jakub Steiner?, Licence: GPL
Program icon for GNOME's webbrowser Web from the GNOME Symbolic Icons set