HtmlToText
les petites cases accueil écrits divers semantic web labs la conservation des données numériques n'est ni une révolution, ni inatteignable le 15 janvier, 2018 - 10:44 — got alors que je m’étonnais dans un tweet , suite à une interview d'anne both , qu'on puisse encore émettre des doutes sur la conservation des données numériques, julien benedetti a attiré mon attention sur la conférence-table ronde " les archives : quoi de neuf " qui a eu lieu à l'ecole des chartes le 12 décembre dernier avec trois éminents archivistes(-paléographes) : christine nougaret, bruno galland et edouard bouyé. et pour se faire un peu peur cette conférence de l’enc https://t.co/0kiskafurq faut être bien assis par moment pour pas s’effondrer. — julien benedetti (@macgraveur) 24 décembre 2017 etant donné les mots de julien benedetti, je me doutais bien que le sujet serait abordé sous l'angle défaitiste qui le caractérise depuis plusieurs années, mais je ne m'attendais pas à entendre deux grands professionnels des archives se sentir aussi démunis face à cette question . lorsqu'on visionne les quelques minutes (de 34 min à 47 min environ...) consacrées à ce sujet, on s'aperçoit que les manques sont à tous les niveaux : formation, organisationnel, technique, stratégique et même économique. je comprends alors mieux les mots d'anne both qui ne fait que retranscrire ce que les archivistes ont pu lui dire à ce sujet. lire la suite... système d'information causeries conservation réaliser un mashup de données avec dataiku dss et palladio le 5 mars, 2017 - 13:59 — got dans mon précédent billet sur la préparation des données , j'avais fait part de mon enthousiasme pour la solution dss de dataiku dans le cadre de la préparation des données. j'ai donc poursuivi ma pratique du logiciel dans un contexte que j'apprécie particulièrement : la mise au point d'un mashup de données . cet exercice permet autour d'un exemple concret de faire le tour du traitement des données : recherche, récupération, interrogation, structuration, nettoyage, mise en relation, visualisation. il est donc parfaitement adapté pour évaluer un logiciel en la matière. et le résultat fut à la hauteur : dataiku testé et approuvé pour réaliser un mashup avec données du @lecnc sur @datagouvfr , @wikidata , @themoviedb visualisé avec palladio \°/ pic.twitter.com/0rhqia3ynu — gautier poupeau (@lespetitescases) january 16, 2017 afin de partager cette découverte, j'ai mis au point un tutoriel qui vise à : acquérir les bases, par un exemple concret, pour réaliser un mashup de données ; prendre en main le logiciel dss de dataiku dans le cadre de la préparation et de la mise en relation de jeux de données ; présenter les possibilités de l'application en ligne palladio mise au point par le laboratoire humanities + design de l'université de stanford pour la visualisation de données historiques. lire la suite... management de l'information sparql digital humanities outils geekeries du problème de la qualité des données et de la manière de le résoudre... le 8 janvier, 2017 - 12:42 — got comme le rappelait très justement dominique cardon dans son interview du vendredi 6 janvier sur france inter : « [...]il faut faire attention, les algorithmes, c’est idiot , c’est une procédure statistique un peu bête qui utilise des données pour faire un grand calcul massif[...] » comme l'a expliqué dominique cardon malgré les coupures incessantes d'ali baddou (et comme je l'avais fait beaucoup plus modestement ), l'algorithme n'est pas une entité en soi : ce n'est qu'un code source mis au point par un humain qui détermine la « procédure statistique » exécuté sur et grâce à des données . ces dernières sont donc d'une importance fondamentale. il y a presque 10 ans , christian fauré faisait état sur son blog d’une certaine déception des organisations devant les résultats des outils de reporting et de business intelligence au regard de l’investissement effectué pour les déployer. il revenait alors sur un point essentiel : ce genre d’outils ne donne leur plein potentiel que si les données sont propres, le fameux adage en traitement des données : « shit in, shit out ». dix ans plus tard, on sent souvent poindre la même déception concernant le big data car rien a changé pour le traitement des données : les algorithmes ont plus que jamais besoin de données « propres » pour fonctionner . par exemple, la pertinence des systèmes de catégorisation automatique dépend presque intégralement de la qualité du corpus utilisé pour effectuer l’entraînement du système. ainsi, on voit apparaître régulièrement des statistiques montrant que les « data scientists » passent presque 80% de leur temps à sélectionner, nettoyer et préparer les données (cf. ces articles du new york times de 2014 et de forbes en 2016 ). vous y réfléchissez à deux fois avant de faire cet investissement quand vous savez le prix de ce genre de compétence. or, ce travail n’est pas plus « sexy » aujourd’hui qu’il y a dix ans pour reprendre les termes employés par christian. en revanche, étant donné la valeur (réelle ou supposée…) créée par ces algorithmes, des solutions commencement à émerger et la préparation des données (on parle aussi de data wrangling en anglais) est peu à peu devenue un enjeu jusqu’à devenir une des tendances annoncée du « big data » pour 2017 . lire la suite... management de l'information geekeries comment mettre la donnée au coeur du si ? le 19 novembre, 2016 - 10:39 — got j’ai eu l’honneur et le plaisir de participer le 17 novembre à la conférence annuelle de talend , le talend connect 2016 , pour présenter comment, à l’ina, nous avons mis la donnée au coeur de la refonte de notre système d’information. voilà une bonne occasion pour lever le voile sur ce projet qui m’occupe depuis deux ans et dont je parlais dans mon billet de bilan , au passage de respecter la promesse de le présenter plus longuement et de continuer à alimenter ce blog… @pierrecol il y aura une comm' au prochain @talend connect, j'en profiterai peut-être pour en parler sur blog — gautier poupeau (@lespetitescases) august 26, 2016 voici le diaporama qui accompagnait ma présentation : contexte du projet quatre raisons principales nous ont amenés à mener cette réflexion : l’urbanisation du si . comme tous les si, celui de l’ina s’est créé par couches successives selon les besoins métiers. de fait, il est composé de différents silos étanches répondant chacun à un besoin métier spécifique. telle une myriade d’orchestre de chambres voire de solistes, les solutions de stockage et d’interrogation des données sont disséminées à travers l’ensemble du si : différents sgbdr, instances de moteurs de recherche avec pour certains des index très proches, des scripts de traitement de données (export, import, calcul) un peu partout souvent pas ou peu supervisés dans des technos différentes et dont la maintenance s’avère fastidieuse. suivant les différents axes de notre schéma directeur (robustesse, rationalisation et alignement stratégique), nous voulions transformer ces myriades de petits orchestres en une formation unique : un orchestre symphonique, plus facile à maîtriser, à diriger et à faire évoluer. la refonte de notre si métier il existe historiquement deux collections à l’ina (le dépôt légal et les archives dites professionnelles qui font l’objet d’une valorisation commerciale) qui, jusqu’à peu, étaient gérées par deux directions différentes avec deux si différents. regroupé depuis 3 ans au sein d’une direction unique, le métier souhaite maintenant disposer d’un si unique. il faut donc envisager la migration de sept instances de bases de données oracle avec des structure et des logiques de données qui semblent identiques de loin mais qui s’avèrent bien différentes. en effet, les pratiques de travail sont différentes : l’objectif du dépôt légal est de documenter le flux pour en assurer la mémoire alors que les archives professionnelles sont documentées en vue de leur valorisation commerciale ou à destination du grand publi
Informations Whois
Whois est un protocole qui permet d'accéder aux informations d'enregistrement.Vous pouvez atteindre quand le site Web a été enregistré, quand il va expirer, quelles sont les coordonnées du site avec les informations suivantes. En un mot, il comprend ces informations;
Domain Name: LESPETITESCASES.NET
Registry Domain ID: 142293134_DOMAIN_NET-VRSN
Registrar WHOIS Server: whois.ovh.com
Registrar URL: http://www.ovh.com
Updated Date: 2018-01-28T17:16:39Z
Creation Date: 2005-02-12T12:44:17Z
Registry Expiry Date: 2019-02-12T12:44:17Z
Registrar: OVH
Registrar IANA ID: 433
Registrar Abuse Contact Email:
Registrar Abuse Contact Phone:
Domain Status: clientDeleteProhibited https://icann.org/epp#clientDeleteProhibited
Domain Status: clientTransferProhibited https://icann.org/epp#clientTransferProhibited
Name Server: DNS.OVH.NET
Name Server: NS.OVH.NET
DNSSEC: unsigned
URL of the ICANN Whois Inaccuracy Complaint Form: https://www.icann.org/wicf/
>>> Last update of whois database: 2018-03-21T20:00:11Z <<<
For more information on Whois status codes, please visit https://icann.org/epp
NOTICE: The expiration date displayed in this record is the date the
registrar's sponsorship of the domain name registration in the registry is
currently set to expire. This date does not necessarily reflect the expiration
date of the domain name registrant's agreement with the sponsoring
registrar. Users may consult the sponsoring registrar's Whois database to
view the registrar's reported date of expiration for this registration.
TERMS OF USE: You are not authorized to access or query our Whois
database through the use of electronic processes that are high-volume and
automated except as reasonably necessary to register domain names or
modify existing registrations; the Data in VeriSign Global Registry
Services' ("VeriSign") Whois database is provided by VeriSign for
information purposes only, and to assist persons in obtaining information
about or related to a domain name registration record. VeriSign does not
guarantee its accuracy. By submitting a Whois query, you agree to abide
by the following terms of use: You agree that you may use this Data only
for lawful purposes and that under no circumstances will you use this Data
to: (1) allow, enable, or otherwise support the transmission of mass
unsolicited, commercial advertising or solicitations via e-mail, telephone,
or facsimile; or (2) enable high volume, automated, electronic processes
that apply to VeriSign (or its computer systems). The compilation,
repackaging, dissemination or other use of this Data is expressly
prohibited without the prior written consent of VeriSign. You agree not to
use electronic processes that are automated and high-volume to access or
query the Whois database except as reasonably necessary to register
domain names or modify existing registrations. VeriSign reserves the right
to restrict your access to the Whois database in its sole discretion to ensure
operational stability. VeriSign may restrict or terminate your access to the
Whois database for failure to abide by these terms of use. VeriSign
reserves the right to modify these terms at any time.
The Registry database contains ONLY .COM, .NET, .EDU domains and
Registrars.
REGISTRAR OVH
SERVERS
SERVER net.whois-servers.net
ARGS domain =lespetitescases.net
PORT 43
TYPE domain
RegrInfo
DOMAIN
NAME lespetitescases.net
CHANGED 2018-01-28
CREATED 2005-02-12
STATUS
clientDeleteProhibited https://icann.org/epp#clientDeleteProhibited
clientTransferProhibited https://icann.org/epp#clientTransferProhibited
NSERVER
DNS.OVH.NET 213.186.33.102
NS.OVH.NET 213.251.128.136
REGISTERED yes
Go to top