L'histoire d'Internet remonte au développement des premiers réseaux de télécommunication. L'idée d'un réseau informatique, permettant aux utilisateurs de différents ordinateurs de communiquer, se développa par de nombreuses étapes successives. La somme de tous ces développements conduisit au "réseau des réseaux" (network of networks) que nous connaissons aujourd'hui en tant qu'Internet. Il est le fruit à la fois de développements technologiques et du regroupement d'infrastructures réseau existantes et de systèmes de télécommunications.
Les premières versions mettant en place ces idées apparurent à la fin des années 1950.L'application pratique de ces concepts commença à la fin des années 1960. Dès les années 1980, les techniques que nous reconnaissons maintenant comme les fondements d'Internet moderne commencèrent à se répandre autour du globe. Dans les années 1990, sa popularisation passa par l'apparition du World Wide Web.
L'infrastructure d'Internet se répandit autour du monde pour créer le large réseau mondial d'ordinateurs que nous connaissons aujourd'hui. Il se répandit au travers des pays occidentaux puis frappa à la porte des pays en voie de développement, créant ainsi un accès mondial à l'information et aux communications sans précédent ainsi qu'une fracture numérique. Internet contribua à modifier fondamentalement l'économie mondiale, y compris avec les retombées de la bulle Internet.
Chronologie sélective
Les principales dates qui ont marqué l'histoire d'Internet sont:
Année
|
Evènement
|
1958
|
La société
BELL crée le premier Modem permettant de transmettre des données binaires sur
une simple ligne téléphonique
|
1961
|
Leonard
Kleinrock du Massachussetts Institute of Technology publie une première
théorie sur l’utilisation de la communication de paquets pour transférer des
données.
|
1962
|
Début de la
recherche par ARPA, une agence du ministère de la Défense américain, où
J.C.R. Licklider y défend avec succès ses idées relatives à un réseau global
d’ordinateurs.
|
1964
|
Leonard
Kleinrock du MIT publie un livre sur la communication par commutation de
paquets pour réaliser un réseau.
|
1967
|
Première
conférence sur ARPANET
|
1969
|
Connexion des
premiers ordinateurs entre 4 universités américaines via l’Interface Message
Processor de Leonard Kleinrock.
|
1971
|
23 ordinateurs
sont reliés sur ARPANET. Envoi du premier courriel par Ray Tomlinson
|
1972
|
Naissance du
InterNetworking Working Group, organisme chargé de la gestion d’Internet
|
1973
|
L’Angleterre
et la Norvège rejoignent le réseau Internet avec chacun 1 ordinateur
|
1973
|
Définition du
protocole TCP/IP
|
1979
|
Création des
NewsGroups (forums de discussion) par des étudiants américaisn
|
1983
|
Adoption du
protocole TCP/IP et du mot « Internet »
|
1983
|
Premier
serveur de noms de sites
|
1984
|
1 000 ordinateurs
connectés
|
1987
|
10 000 ordinateurs
connectés
|
1989
|
100 000 ordinateurs
connectés
|
1990
|
Disparition d’ARPANET
|
1990
|
Annonce
publique du World Wide Web
|
1992
|
1 000 000
ordinateurs connectés
|
1993
|
Apparition du
Navigateur Web NCSA Mosaic
|
1996
|
36 000 000
ordinateurs connectés
|
2000
|
Explosion de
la Bulle internet (368 540 000 ordinateurs connectés)
|
Avant Internet
L'absence de connexions inter-réseaux
Avant la propagation des connexions inter-réseaux qui amena l'Internet actuel, la plupart des réseaux de communication étaient limités de par leur nature à des communications entre les postes du réseau. Quelques réseaux avaient des passerelles ou des ponts les reliant entre eux, mais la plupart du temps ils étaient limités ou conçus pour un usage unique. Une méthode déjà utilisée dans les réseaux de télécommunication reposait sur l'utilisation d'un ordinateur central, permettant simplement à ses terminaux d'être raccordés via de longues lignes. Cette méthode fut utilisée dans les années 1950 par le projet RAND afin de permettre la collaboration de chercheurs tels qu'Herbert Simon, alors situé à Pittsburgh en Pennsylvanie, et les chercheurs de Santa Monica en Californie, tous travaillant sur la démonstration assistée par ordinateur et l'intelligence artificielle.
Trois terminaux et une agence du Département de la Défense des Etats-Unis
Un pionnier important dans l'histoire du réseau mondial, J.C.R. Licklider, mit en avant l'idée, dans sa publication de janvier 1960, Man-Computer Symbiosis" ("La symbiose homme-ordinateur"):
En octobre 1962, J.C.R. Licklider fut promu à la tête du bureau de traitement de l'information de la Défense Advanced Research Projects Agency (DARPA ou ARPA) sous tutuelle du Département de la Défense des Etats-Unis, et forma un groupe informel à l'intérieur de la DARPA afin de développer la recherche informatique. Trois terminaux furent installés sous la tutelle du bureau de traitement de l'information. Un pour System Development Corporation à Santa Monica, Californie, un pour Project Genie à l'Université de Californie à Berkeley et un pour le projet Multics à l'Institut de Technologie du Massachusetts (MIT). De par les problèmes rencontrés, les besoins de création d'inter-réseaux de J.C.R. Licklider devinrent alors évidents:
Répartitions et aiguillages de paquets de données
Au coeur du problème de connexion inter-réseau résidait la question de connecter plusieurs réseaux physiquement séparés pour ne former qu'un seul réseau logique. Au cours des années 1960, plusieurs groupes ont travaillé sur l'élaboration de l'aiguillage de paquets (pack switching en anglais). Donald Davies (National Physical Laboratory), Paul Baran (Research and Development RAND Corporation) et Leonard Kleinrock (Massachusettes Institute of Technology) se sont vu attribuer l'invention simultanément.La notion d'Internet développé pour survivre à une attaque nucléaire trouve racine dans les premières théories développées par le RAND, mais ce n'est autre qu'une "légende urbaine" qu'aucun document officiel n'appuie. Les recherches de Paul Baran ont approché l'aiguillage de paquet par des études de décentralisation afin d'éviter que des dégradations liées à des combats puissent remettre en cause l'intégrité du réseau.
Les réseaux qui conduisirent à Internet
Le réseau ARAPNET
Promu à la tête du bureau de traitement de l'information à L'ARPA, Matt Racoon avait pour but de concrétiser les idées de J.C.R. Licklider sur les systèmes de réseaux interconnectés. En compagnie de Larry Roberts, qui travaillait au MIT, il décida de créer un tel réseau. Le premier lien ARPANET (ARPA Network) fut établi entre l'université de Californie à Los Angeles et le Stanford Research Institute le 21 novembre 1969. Dès le 5 décembre 1969, en y ajoutant l'université d'Utah et l'université de Californie à Santa Barbara, un réseau à 4 noeuds voyait le jour. A partir de 1972, le réseau (construit sur les idées développées en ALOHAnet) se développa rapidement jusqu'en 1981, date à laquelle le nombre d'hôtes s'élevait à 213 avec un rythme de croissance soutenu atteignant alors un nouvel hôte tous les 20 jours environ.
Il devint le coeur technique de ce qu'est devenu Internet, ainsi qu'un outil primaire de développement de cette nouvelle technique. Son développement fut recentré sur les processus RFC, toujours utilisés de nos jours pour proposer et distribuer les protocoles et système Internet. RFC1, dénommé "Host Softwre" (littéralement "logiciel hôte"), fut codé par Steve Crocker de l'université de Californie à Los Angeles, et publié le 7 avril 1969.
Les collaborations internationales sur le projet ARPANET restèrent rares. Pour diverses raisons politiques, les développeurs européens travaillaient sur le développement du réseau X.25. Avec quelques exceptions telles que: Norwegian Seismic Array (NORSAR) en 1972, suivi en 1973 par la Suède et sa liaison satellite entre Tanum et l'University College de Londres.
Ces premières années ont été mises en scène par Steven King dans son film documentaire de 1972 Computer Networks: The Heralds of Ressource Sharing (que l'on peut traduire par "Les Réseaux Informatiques: les prémices du partage des ressources").
X.25 et accès public
Les réseaux à ordonnance de paquets ont été développés par l'Union internationale des télécommunications en poursuivant les recherches de la DARPA et en utilisant les formes de réseau X.25. En 1974, ce dernier sert de base au développement du réseau SERCnet reliant les académiciens anglais avec leurs sites de recherche, qui deviendra par la suite JANET lors de son association avec le Joint Academic NETwork. En mars 1976 l'Union internationale des télécommunications lance le premier standard en X.25.
En 1978, le Bureau de poste anglais Western Union International, et Tymnet participèrent à la création de l'International Packet Switched Service, le premier réseau international à aiguillage de paquets. Ce réseau s'étendit depuis l'Europe et les Etats-Unis pour couvrir en 1981 le Canada, Hong Kong et l'Australie. Dès le courant des années 1990, il fournissait une infrastructure réseau mondiale.
Contrairement à l'ARPANET, le X25 était disponible dans le monde de l'entreprise. Il sera utilisé pour les premiers réseaux téléphoniques publics, tels CompuServe et Tymnet. En 1979, CompuServe fut le premier service capable de proposer un courrier électronique ainsi qu'un support technique aux utilisateurs d'ordinateurs personnels. Cette société repoussa une nouvelle fois les barrières des télécommunications en proposant l'année suivante des discussions en temps réel grâce à son CB Simulator, un simulateur radio. Il y eut aussi les réseaux America Online (AOL) et Prodigy ainsi que de nombreux réseaux bulletin board system comme The WELL et FidoNet. Ce dernier était particulièrement populaire dans le milieu des hackers et radioamateurs.
Unix to Unix Copy Protocol
En 1979, deux étudiants à l'Université Duke, Tom Truscott et Jim Ellis, ont eu l"idée d'utiliser de simples scripts en Bourne shell afin de transférer des informations et des messages en se servant d'une liaison série avec l'université voisine de Chapel Hill. En suivant les mises à jour publiques du logiciel se propageant sur l'Usenet, le réseau d'hôte Unix to Unix Copy Protocol (UUCP) se développa rapidement. UUCPnet, comme il sera nommé plus tard, entraîna la création de nombreuses passerelles et autres liens entre les hôtes FidoNet et Bulletin board system. Les réseaux UUCP se répandirent rapidement, grâce à leur coût peu élevé et leur capacité à utiliser les lignes téléphoniques existantes, comme les liens X25, et même les connexions ARPANET. Le nombre d'hôtes des réseaux UUCP était de 550 en 1983, puis 940 en 1984.
Unification des réseaux et la création d'Internet
Protocole TCP/IP
Cartographie du test du réseau TCP/IP en janvier 1982
L'abondante diversité des méthodes de communications réseau amena un besoin d'uniformisation. Robert E.Kahn recruta Vinton G.Cerf de l'université Stanford dans le but de travailler ensemble sur ce problème. En 1973, ils avaient déjà réalisé une reformulation profonde, dans laquelle les différences entre les protocoles s'estompaient par l'utilisation d'un protocole de communication: au lieu d'assoir la fiabilité du réseau sur les connexions, comme avec l'ARPANET, les hôtes en étaient maintenant responsables. Vinton G. Cerf attribua à Hubert Zimmerman et Louis Pouzin (développeurs du réseau Cyclades) un important travail de développement.
Avec le rôle du réseau physique réduit à son strict minimum, il devint alors possible de fusionner à peu près tout type de réseau sans tenir compte de leurs caractéristiques et ainsi résoudre le problème que s'était posé Robert E.Kahn à ses débuts. La DARPA accepta de financer le développement du logiciel prototype, et après plusieurs années de travail, la première démonstration quelque peu rustique de ce qu'était alors devenu le TCP/IP eut lieu en juillet 1977. Cette nouvelle méthode se répandit au travers des réseaux, et le 1er janvier 1983 les protocoles TCP/IP devenaient officiellement le seul protocole sur l'ARPANET, remplaçant le précédent protocole NCP.
Du réseau de l'ARPA à celui de la National Science Foundation
Après que l'ARPANET avait été en service pendant plusieurs années, l'agence chercha une autre entité pour prendre en charge le réseau car cela dépassait ses attributions initiales: ARPA était censé financer la recherche et le développement et non entretenir un réseau de télécommunication. Finalement en juillet 1975 le réseau passa sous la responsabilité de la Defense Communications Agency, partie intégrante du département de la Défense. En 1983 la partie de l'ARPANET appartenant aux Forces armées des Etats-Unis fut séparée du reste du réseau et devint le MILNET (Military Network)
Les réseaux construits autour de l'ARPANET étaient financés par le gouvernement et de ce fait restreints à une utilisation non commerciale et en particulier la recherche, toute utilisation commerciale sans fondement était alors strictement interdite.
Les connexions étaient initialement restreintes aux sites de l'armée et aux universités. Dans les années 1980, les connexions se sont étendues à de nombreuses institutions éducatives ainsi qu'à un nombre croissant de sociétés telles que Digital Equipment Corporation et Hewlett-Packard, qui participaient aux projets de recherche ou offraient leurs services aux connectés.
Une autre partie de l'Administration américaine, la National Science Foundation (NSF), s'impliqua largement dans la recherche et commença le développement du successeur de l'ARPANET. En 1984, ceci aboutit au premier réseau étendu conçu spécialement pour l'utilisation du TCP/IP. Celui-ci s'agrandit au travers de la dorsale Internet NSFNet, mise en place en 1986, qui avait pour but de raccorder et fournir l'accès à un nombre de centre de superordinateurs mis en place par la National Science Foundation.
Transition en vue d'un Internet
C'est à l'époque où le réseau de l'ARPA commença à fusionner avec celui de la National Science Foundation que le terme "Internet" apparut, "un internet" signifiait alors un réseau utilisant le protocole TCP/IP. "Internet" prit le sens nouveau d'un réseau mondial étendu utilisant le protocole TCP/IP, ce qui à l'époque signifiait NSFNet et ARPANET. Auparavant "internet" et "internetwork" (inter-réseau en français) étaient utilisés de manière équivalente, et "protocole internet" faisant référence aux autres systèmes réseaux comme le Xerox Network Services.
Grâce à l'intérêt grandissant pour les vastes réseaux de communication et à l'arrivée de nouvelles applications, les techniques d'Internet se propagèrent sur le reste du globe. La vision TCP/IP d'Internet se privant de réseau, amena une facilité d'utilisation de tout type de réseaux existants, tel que le réseau X25 d'IPSS, pour transporter les messages. En 1984, l'University College de Londres remplaça sa liaison transaltantique satellite par le réseau IPSS utilisant le protocole TCP/IP.
De nombreux sites incapables de se raccorder directement à Internet commencèrent la création de portails simples permettant le routage du courrier, l'application la plus importante à l'époque.Les sites possédant uniquement des connexions intermittentes utilisaient les réseaux UUCP ou FidoNet et reposaient sur les portails entre ces derniers et Internet. Certains portails allèrent au-delà du simple acheminement de courriers électroniques et proposèrent l'accès à des sites FTP via l'UUCP ou le courrier électronique.
Le protocole TCP/IP devient mondial
La première connexion sortant du territoire américain fut établie avec NORSAR en Norvège peu de temps avant le raccordement avec la Grande-Bretagne. Ces liaisons furent converties en TCP/IP en 1982, avec le reste du réseau ARPANET.
L'internet européen et le lien à travers le Pacifique
En 1984, l'Europe commença sa conversion vers une utilisation plus étendue du protocole TCP/IP, et le réseau du Conseil européen pour la recherche nucléaire ne fit pas exception. Cependant il resta isolé du reste d'Internet jusqu'en 1989.
En 1988, Daniel Karrenberg du Centrum voor Wiskunde en Informatica d'Amsterdam rendit visite à Ben Segal, coordinateur TCP/IP au CERN, il cherchait des conseils concernant la transition du réseau UUCP Usenet européen (dont la majeure partie tournait avec les liens X25) vers le TCP/IP. En 1987 Ben Segal avait rencontré Len Bosack de chez Cisco, encore une petite entreprise à l'époque, spécialisé dans les routeurs TCP/IP, il fut capable de conseiller Daniel Karrenberg et le dirigea vers Cisco pour ses besoins matériels. Ceci développa la partie européenne d'Internet au travers du réseau UUCP existant, et en 1989 le CERN ouvrit sa première connexion TCP/IP externe. Ceci coïncida avec la création du RIPE, au départ un groupe d'administrateurs de réseaux IP qui se réunissaient régulièrement pour parler de leurs travaux communs. Plus tard, en 1992, le RIPE fut formellement enregistré en tant que société coopérative à Amsterdam.
Alors que le réseau européen s'érigeait, un autre réseau voyait le jour entre ARPA et les universités australiennes (en) basé lui sur différentes techniques comme le X.25 et l'UCCPNet. Ce dernier était limité en connexion aux réseaux mondiaux de par le coût des communications individuelles via l'UCCP ou le X.25. C'est en 1989 que les universités australiennes rejoignirent l'élan d'uniformisation lancé par l'apparition du protocole IP. L'AARNet fut formé en 1989 par l'Australian Vice-Chancellors'Committee (en) et fournit une base IP dédiée au réseau australien.
Internet commença son entré en Asie à la fin des années 1980.Le Japon qui fondait en 1984 le JUNET, un réseau construit autour du réseau UUCP, se raccorda au NSFNet en 1989. Kobe reçu la rencontre annuelle de l'Internet Sociéty, baptisée INET92. Singapour développa son réseau TECHNET en 1990 la Thaïlande reçu en 1992 une connexion Internet mondiale entre l'université Chulalongkorn et l'UUNET.
Fracture numérique
Alors que les pays développés accédaient à Internet avec leurs infrastructures technologiques, les pays en développement commencèrent à souffrir d'une fracture numérique les privant d'Internet. Dans le début des années 1990, les pays africains utilisaient le X.25 et le modem 2400 bauds UUCP pour les liens internationaux et internetworks. En 1996, un projet lancé par l'agence des Etats-Unis pour le développement international, le Leland initiative commença par développer une connexion complète pour tout le continent. La Guinée, le Mozambique, Madagascar et le Rwanda reçurent des stations satellites en 1997, suivent la Côte d'Ivoire et le Bénin en 1998.
En 1991, la Chine avait un premier réseau TCP/IP, le TUNET de université Tsinghua. La Chine poursuivit et développa sa première connexion à Internet en 1994, elle reliait l'électro-spectromètre de Pékin et l'accélérateur linéaire de l'université Stanford.
Ouverture du réseau au commerce
Evolution du nombre d'hébergeurs internet de 1992 à 2006
L'intérêt pour l'utilisation commerciale d'Internet devint un sujet de débats houleux. Même si l'utilisation commerciale restait interdite, sa définition exacte pouvait être obscure et subjective. Tous étaient d'accord sur le fait qu'une entreprise envoyant une facture à une autre entreprise faisait une utilisation commerciale d'Internet, mais tout le reste était sujet à discussion. L'UUCP et le X.25 ne possédaient pas de telles restrictions qui auraient pu se concrétiser en l'interdiction d'utilisation de l'ARAPANET et du NSFN et par l'UUCP. Cependant les liens UUCP restèrent actifs et les admisitrateurs fermèrent les yeux sur leurs activités.
C'est à la fin des années 1980, que les premières entreprises fournisseur d'accès furent fondées. Des entreprises comme PSIN(en), UUNET (en), Netcom(en), et Portal Software (en) virent le jour afin d'offrir assistance aux réseaux de recherche régionaux et de fournir au particulier des accès au réseau, courriels et nouvelles-Usenet. Le premier fournisseur d'accès à Internet par le réseau téléphonique, The World ouvrit en 1989.
Ceci sema la controverse parmi les utilisateurs universitaires, qui étaient outrés à l'idée d'utiliser le réseau à des fins non éducatives. Finalement ce sont les fournisseurs d'accès qui permirent aux collèges et autres écoles d'accéder aux nouvelles aires d'éducation et de recherche par la baisse des tarifs de connexion.
En 1990 l'ARPANET fut dépassé et remplacé par des techniques plus récentes, ainsi le projet correspondant pris fin. En 1994 le NSFNet, renommé ANSNET (Advanced Networks and Service pour Réseaux avancés et service) et qui permettait l'accès aux sociétés à but non lucratif, perdit sa place d'épine dorsale d'Internet.A la fois les institutions gouvernementales et les fournisseurs créèrent leurs propres épines dorsales et liaisons. Les points d'accès régionaux au réseau (NAP en anglais) devinrent les liens principaux entre les nombreux réseaux et la dernière restriction commerciale tomba.
Maintien de l'infrastructure
L'Internet Engineering Task Force et un standard pour les standards
Internet avait engendré une communauté importante dévouée à l'idée que Internet n'appartenait et n'était régi par aucune personne, aucun groupe, aucune entreprise et aucune organisation. Cependant, des standardisations et un contrôle étaient nécessaires pour le bon fonctionnement du système.
La procédure de publication libre de RFC (Demande de commentaire en français) sema la confusion dans le système de standardisation d'Internet, et introduisit un haut degré de formalisme dans l'acceptation des standards officiels. L'IETF décida en janvier 1986 de mettre en place des réunions trimestrielles avec les chercheurs fonctionnaires. Dès la quatrième assemblée, en octobre de la même année, l'IETF convia des représentants d'organisations non gouvernementales.
L'acceptation de publication d'une RFC par RFC Editor n'implique pas automatiquement son passage en tant que standard. Elle peut être reconnue en tant que telle par l'IETF seulement après que tests, utilisation, et acceptation soient avérés et dignes d'une telle désignation.Les standards officiels sont numérotés avec un préfixe "STD", tout comme les RFC. Dans la majeure partie des cas, même après leur standardisation, elles sont appelées par leur référence RFC.
En 1992, l'Internet Society, une association de membres professionnels, fut formée et l'IETF fut mise sous sa tutelle en tant que corps de standardisation international indépendant.
Network Information Center et autres autorités de coordination
La première autorité centrale à coordonner les opérations du réseau était le Network Information Center, abrégé NIC, du Stanford Research Institute situé à Menlo Park en Californie. En 1972, la gestion de ces problèmes fut transmises à la toute récente Internet Assigned Numbers Authority, abrégée IANA. En plus de son rôle d'éditeur RFC, Jon Postel sera le patron de l'IANA jusqu'à sa mort en 1998.
Alors que le jeune ARPANET grandissait, le référencement d'hôtes se fit par noms et le fichier référence, HOST.TXT, était distribué par SRI International à tous les hôtes du réseau. Avec la croissance du réseau cette procédure devint vite fastidieuse. Une solution technique apparut sous la forme de Domain Name System (Système de nom de domaine), mis en place par Paul Mockapetris. C'est le service DDN-NIC du SRI qui prit en charge (en passant un contrat avec le ministère de la défense américain) tous les services d'enregistrement, comprenant les domaines de premier niveau (Top Level Domain-TLD), la gestion des Serveurs DNS Racine et des numéros Internet. En 1991, la Défense Information Systems Agency (DISA) transféra la gestion et la maintenance de DDN-NIC (alors prises en charge par SRI) à Government Systems Inc.,....qui le sous-traita à une petite entreprise privée Network Solutions.
Alors que la majeure partie de la croissance d'Internet venait de sources non militaires, on décida que le département de la Défense des Etats-Unis ne financerait plus les services d'enregistrement en dehors des TLD en.mil. Après une phase compétitive d'appel d'offre lancée en 1992, c'est l'année suivante que la National Science Foundation créa l'InterNic afin de gérer l'allocation et la base de donnée de l'adressage, elle passa des contrats avec trois organisations. Dorénavant les services d'enregistrement seraient assurés par Network Solutions, les services de répertoires et base de donnée par AT&T, et les services d'information par General Atomics.
En 1998, l'IANA et InterNIC furent placées sous la tutelle de l'ICANN, une association à but non lucratif californienne travaillant pour le compte du ministère du Commerce américain sur la gestion de tâches directement liées à Internet . L'opération des Serveurs DNS Racine fut privatisée et ouvert à la compétition, alors que la gestion centrale d'allocation des noms était distribuée par appel d'offres.
Utilisation et culture
Courrier électronique et Usenet: le développement de forums de texte
Le courrier électronique est souvent considéré comme la Killer application d'Internet. Même si en réalité il précéda la naissance d'Internet et fut un outil crucial pour sa création.Il vit le jour en 1965 en tant que moyen de communication entre les différents utilisateurs d'un ordinateur central à temps partagé. Même si l'histoire n'est pas très précise à ce sujet, parmi les systèmes possédant de telles ressources on compte le Q32 de chez System Development Corporation ainsi que le CTSS du Massachusetts Institute of Technology.
Le réseau d'ordinateurs ARPANET contribua largement au développement du courrier électronique. Il existe un rapport publié juste après l'apparition de l'ARPANET, qui fait référence à des échanges expérimentaux de courrier inter-systèmes. En 1971, Ray Tomlison créa ce qui devait devenir le standard du format d'adressage de courrier, en utilisant le signe @ pour séparer le nom utilisateur du nom d'hôte.
Un certain nombre de protocoles ont été développés afin de permettre le routage du courrier parmi les groupes d'ordinateurs à temps partagé en utilisant des systèmes de distribution différents comme l'UCCP et le système de courrier VNET d'IBM. Le courrier électronique pouvait ainsi passer d'un réseau à un autre (ARPANET, Bitnet et NSFNet et entre autres) et également être transmis à des hôtes qui étaient raccordés sur d'autres sites au travers de l'UCCP.
De plus, l'UCCP permettait la publication de fichiers texte pouvant être lus beaucoup d'autres.Le logiciel News, développé par Steve Daniel et Tom Truscott en 1979, fut utilisé pour l'acheminement de nouvelles et la parution de messages de type petites-annonces. Ceci dérivant vers des groupes de discussion, connus maintenant en tant que newsgroup, abordant des sujets divers et variés. Des groupes de discussion similaires apparurent sur l'ARPANET et le NSFNet au travers de mailing lists, discutant à la fois de problèmes techniques et de sujets culturels plus spécifiques (tel que la science-fiction, abordée sur la mailing list des SFlovers).
Bibliothèque mondiale: de Gopher au World Wide Web
Alors qu'Internet se développait dans les années 1980 et début 1990, le besoin grandissant de moyens de recherche et d'organisation de l'information et des fichiers se faisait ressentir. Des projets tels que Gopher, Wide Area Information Servers (WAIS) et Archie s'essayèrent à créer des solutions pour l'organisation des données distribuées. Malheureusement ces projets se heurtèrent aux difficultés de gestion des différents types de données et de croissance sans limite.
A cette période, un des paradigmes d'interface-utilisateur les plus prmotteurs était l'hypertexte. L'idée trouve son origine dans le Memex de Vannevar Bush et a été développée par Ted Nelson au travers de son Projet Xanadu ainsi que Douglas Engelbart avec le NLS. De nombreux petits systèmes hypertextes avaient été créés auparavant, tels que HyperCard d'Apple.
Tim Berners-Lee fut le premier à développer à partir de 1989 une version d'hypertexte totalement distribuée sur le réseau. Tim Berners-Lee a proposé son idée à maintes reprises et au cours de plusieurs conférences avec les communautés d'Internet et de l'hypertexte sans grand succès. Seul son collègue Robert Cailliau s'enthousiasma immédiatement. Travailleur au CERN, Tim Berners-Lee voulait mettre en place un moyen pour partager les informations sur leurs recherches. En rendant son application publique en 1991, il s'assura une diffusion mondiale. Par la suite, Gopher devint l'interface hypertexte de référence pour Internet. Bien que le menu de Gopher soit constitué de liens hypertexte, les utilisateurs ne les percevaient pas en tant que tels.
Un des premiers navigateurs Web, conçu sur la base d'HyperCard, était le populaire ViolaWWW. Il fut finalement détrôné par NCSA Mosaic, un navigateur graphique développé par une équipe du National Center for Supercomputing Applications de l'Université de l'Illinois à Urbana-Champaign (NCSA-UIUC), où Marc Andreessen était particulièrement actif. Le financement de Mosaic venait du High-Performance Computing and Communications Initiative, un programme de financement mis en place par Al Gore (sénateurà l'époque) et son High Performance Computing Act of 1991. L'interface graphique de Mosaic devint rapidement plus populaire que l'utilisation préférée d'Internet. Mosaic fut supplanté en 1994 par le Netscape Navigator, qui devint en quelques mois le navigateur le plus populaire au monde. Depuis, la concurrence avec Internet Explorer de Microsoft l'a évincé. Des anciens de Netscape développèrent Mozilla puis Firefox.Les deux principaux navigateurs actuels sont Firefox et Internet Explorer, même si on note la présence d'autres acteurs dont, par exemple, Safari, Opéra ou Chrome.
Moteur de recherche
Même avant le World Wide Web, il existait des moteurs de recherche qui essayaient d'organiser Internet. Le premier d'entre eux fut Archie de l'Université McGill de Montréal en 1990, suivi en 1991 par les WAIS et Gopher. Ces trois système existaient avant l'avènement du World Wide Web mais continuèrent à indexer Internet après son apparition. Les serveurs Gopher existaient encore en 2006.
Avec le développement du Web, des moteurs de recherche et des répertoires Internet furent créés pour permettre de trouver des informations parmi les pages Web.Le premier moteur de recherche sur Internet permettant de chercher dans le corps des pages Web fut WebCrawler en 1994. Avant lui, les recherches ne s'effectuaient que sur les titres des pages. Un autre moteur de recherche fut créé en 1993 en tant que projet universitaire: Lycos. Il était alors un des premiers succès commerciaux. En janvier 1999, Google référençait plus de 60 millions de pages et la croissance a continué depuis, même si la vraie avancée ne se fit pas tant en termes de taille de base de données, que sur le classement en degré de pertinence, les méthodes avec lesquelles les moteurs de recherche essayent d'ordonner les résultats de telle sorte que le meilleur soit en premier.
Ces algorithmes de classification n'ont pas cessé de s'améliorer depuis 1996, lorsque cela devint critique à cause de la croissance rapide de la toile qui rendit toute recherche fastidieuse par le nombre important de résultats renvoyés. En 2006, les méthodes d'ordonnancement sont plus importantes que jamais, étant donné que parcourir une liste entière de résultats est non seulement peu commode mais humainement impossible, en effet les pages traitant de sujets populaires apparaissent sur la toile trop vite pour que n'importe qui puisse les lire toutes. La méthode PageRank de Google pour l'ordonnancement des résultats est celle qui a reçu les meilleures critiques, cependant tous les grands moteurs de recherche affinent continuellement leurs méthodes afin d'améliorer le classement des résultats.
Internet
Internautes par millier d'habitants dans le monde en 2009
Internet est un système d'interconnexion de machine et constitue un réseau informatique mondial, utilisant un ensemble standardisé de protocoles de transfert de données. C'est donc un réseau de réseaux, sans centre névralgique, composé de millions de réseaux aussi bien publics que privés, universitaires, commerciaux et gouvernementaux. Internet transporte un large spectre d'information et permet l'élaboration d'applications et de services variés comme le courrier électronique, la messagerie instantanée et le World Wide Web.
Internet ayant été popularisé par l'apparition du World Wide Web, les deux sont parfois confondus par le public non averti. Le World Wide Web n'est pourtant que l'une des applications d'Internet.
L'accès à Internet peut être obtenu grâce à un fournisseur d'accès à Internet via divers moyens de communication électronique: soit filaire (réseau téléphonique commuté (bas débit), ADSL, fibre optique jusqu'au domicile), soit sans fil (WiMAX, par satellite, 3G+). Un utilisateur d'Internet est désigné par le néologisme "internaute".
Visualisation des multiples chemins à travers une portion d'Internet
Terminologie
Le terme d'origine américaine "Internet" est dérivé du concept d'internetting (en français: "interconnecter des réseaux") dont la première utilisation documentée remonte à octobre 1972 par Robert E.Kahn au cours de la première ICCC (International Conference on Computer Communications) à Washington.
Les origines exactes du terme Internet restent à déterminer. Toutefois, c'est le 1er janvier 1983 que le nom "Internet", déjà en usage pour désigner l'ensemble d'ARPANET et plusieurs réseaux informatiques, est devenu officiel.
En anglais, on utilise un article défini et une majuscule, ce qui donne the Internet. Cet usage vient du fait que "Internet" est de loin le réseau le plus étendu, le plus grand "internet" du monde, et donc, en tant qu'objet unique, désigné par un nom propre. Un internet (un nom commun avec "i" minuscule) est un terme d'origine anglaise utilisé pour désigner un réseau constitué de l'interconnexion de plusieurs réseaux informatiques au moyen de routeurs.
Une publication au Journal officiel de la République française indique qu'il faut utiliser le mot "internet" comme un nom commun, c'est-à-dire sans majuscule. L'Académie française recommande de dire "l'Internet". Il existe une controverse sur le sujet entre les partisans des expressions "l'Internet", "l'Internet", "Internet" et "internet".
Historique
Les mémos que Licklider du Massachussetts Institute of Technology (MIT) écrivit en juillet 1962 sont les plus anciens textes décrivant les interactions sociales qui seraient possibles avec un réseau d'ordinateurs. Cela devait notamment faciliter les communications entre chercheurs de la Défense Advanced Research Projects Agency (DARPA). En octobre 1962, Licklider fut le premier chef du programme de recherche en informatique de la DARPA. En octobre 1962, Licklider fut le premier chef du programme de recherche en informatique de la DARPA. Il persuada ses successeurs Ivan Sutherland, Bob Taylor et le chercheur du MIT Lawrence G.Roberts de l'intérêt des réseaux informatiques.
En 1961, Leonard Kleinrock du MIT publia le premier texte théorique sur les télécommunications par paquets et en 1964 il publia le premier livre sur le sujet.
En 1965, Roberts testa avec Thomas Merrill la première connexion informatique à longue distance, entre le Massachusetts et la Californie. Le résultat montra que des ordinateurs pouvaient travailler ensemble à distance, mais que le mode de télécommunication par établissement de circuit du système téléphonique était inadapté. Le concept de communication par paquets de Kleinrock s'imposa.
En 1966, Roberts fut engagé par Taylor à la DARPA pour concevoir l'ARPANET. Il publia les plans en 1967. En présentant ce texte, il découvrit deux autres groupes de chercheurs travaillant indépendamment sur le même sujet: un groupe du National Physical Laboratory (NPL) du Royaume-Uni avec Donald Davies et Roger Scantlebury, et un groupe de la RAND Corporation avec Paul Baran.
Entre 1962 et 1965, le groupe de la RAND avait étudié la transmission par paquets pour l'armée américaine. Le but était de pouvoir maintenir les télécommunications en cas d'attaque (éventuellement nucléaire), ce que permet une transmission par paquets dans un réseau non centralisé. Il s'agissait d'un développement indépendant d'ARPANET: bien que probablement robuste face à une telle attaque, ARPANET n'a pourtant été conçu que pour faciliter les télécommunications entre chercheurs. Le rapport de Paul Baran est resté purement théorique, et est rapidement tombé dans l'oubli. Mais le mythe d'"ARPANET comme dernier rempart à une attaque atomique" trouve là son origine.
Pendant ce temps, au British National Physical Laboratory, l'équipe de Donald Davies avait progressé: NPL Network, le premier réseau maillé fondé sur la transmission de datagrammes (packets) était fonctionnel. Mais l'histoire d'Internet n'a pas été écrite par les Européens: ARPANET sera désormais l'origine officielle d'Internet.
En août 1968, la DARPA accepta de financer le développement du matériel de routage des paquets d'ARPANET. Ce développement fut confié en décembre à un groupe de la firme Bolt, Beranek and Newman (BBN) de Boston. Ce dernier travailla avec Bob Kahn sur l'architecture du réseau. Roberts améliorait les aspects topologiques et économiques du réseau. Kleinrock préparait des systèmes de mesures du réseau.
Le 20 septembre 1969, BBN installa le premier équipement à l'UCLA où travaillait Kleinrock. Le second noeud du réseau fut installé au Stanford Research Institute (SRI) où travaillait Douglas Engelbart sur un projet d'hypertexte. Deux noeuds supplémentaires furent ajoutés avec l'université de Santa Barbara et l'université d'Utah. Fin 1969, ARPANET comptait donc quatre noeuds.
Le Network Working Group (NWG) conduit par Steve Crocker finit le protocole de communication poste-à-poste NCP en décembre 1970. Ce protocole fut adopté entre 1971 et 1972 par les sites branchés à ARPANET. Ceci permit le développement d'applications par les utilisateurs du réseau.
En 1972, Ray Tomlinson mit au point la première application importante: le courrier électronique. En octobre 1972, Kahn organisa la première démonstration à grande échelle d'ARPANET à l'International Computer Communication Conférence (ICCC). C'était la première démonstration publique.
Le concept d'Internet est né d'ARPANET. L'idée était de permettre la connexion entre les réseaux divers: ARPANET, des communications avec les satellites, des communications par radio. Cette idée fut introduite par Kahn en 1972 sous le nom de Internetting. Le protocole NCP d'ARPANET ne permettait pas d'adresser des hôtes hors d'ARPANET ni de corriger d'éventuelles erreurs de transmission. Kahn décida donc de développer un nouveau protocole, qui devint finalement TCP/IP.
En parallèle, un projet inspiré par ARPANET était dirigé en France par Louis Pouzin: le projet Cyclades. De nombreuses propriétés de TCP/IP ont ainsi été développées, plus tôt, pour Cyclades. Pouzin et Kahn indiquent que TCP/IP a été inspiré par Cyclades.
En 1973, Kahn demanda à Vint Cerf (parfois appelé le père d'Internet) de travailler avec lui, car Cerf connaissait les détails de mise en oeuvre de NCP. Le premier document faisant référence à TCP est écrit en 1973 par Cerf: A Partial Specification of an International Transmission Protocol. La première spécification formelle de TCP date de décembre 1974, c'est le RFC675.
La version initiale de TCP ne permettait que la communication en établissant un circuit virtuel. Cela fonctionnait bien pour le transfert de fichiers ou le travail à distance, mais n'était pas adapté à des applications comme la téléphonie par Internet. TCP fut donc séparé de IP et UDP proposé pour les transmissions sans établissement d'un circuit.
A la fin des années 1980, la NSF (National Science Foundation) qui dépend de l'administration américaine, met en place cinq centres informatiques surpuissants, auxquels les utilisateurs pouvaient se connecter, quel que soit le lieu où ils se trouvaient aux Etats-Unis: ARPANET devenait ainsi accessible sur une plus grande échelle. Le système rencontra un franc succès et, après la mise à niveau importante (matériels et lignes) à la fin des années 1980, s'ouvrit au trafic commercial au début des années 1990.
Le début des années 1990 marque, en fait, la naissance de l'aspect le plus connu d'Internet aujourd'hui: le web, un ensemble de pages en HTML mélangeant du texte, des liens, des images, adressables via une URL et accessibles via le protocole HTTP. Ces standards, développés au CERN par Tim-Berners-Lee et Robert Cailliau devinrent rapidement populaires grâce au développement au NCSA par Marc Andreessen et Eric Bina du premier navigateur multimédia Mosaic.
En janvier 1992, l'Internet Society (ISOC) voit le jour avec pour objectif de promouvoir et de coordonner les développements sur Internet. L'année 1993 voit l'application du premier navigateur web ou butineur (browser), supportant le texte et les images. Cette même année, la National Science Foundation (NSF) mandate une compagnie pour enregistrer les noms de domaine.
Gouvernance
Nombre d'utilisateurs par pays en 2006
Selon la définition du groupe de travail sur la gouvernance d'Internet, il faut entendre par "gouvernance de l'Internet" l'élaboration et l'application par les Etats, le secteur privé et la société civile, dans le cadre de leurs rôles respectifs, de principes, normes, règles, procédures de prise de décisions et programmes communs propres à modeler l'évolution et l'usage de l'Internet.
Les registres de métadonnées sont importants dans l'établissement de règles d'accès aux ressources web qui utilisent les Uniform Ressource Identifiers (qui peuvent être les URL qui s'affichent sur la barre de navigation de l'ordinateur personnel).
Un certain nombre d'organismes sont chargés de la gestion d'Internet, avec des attributions spécifiques. Ils participent à l'élaboration des standards techniques, l'attribution des noms de domaines, des adresses IP, etc...:
-Internet Corporation for Assigned Names and Numbers (ICANN), sous la tutelle du Département du Commerce des Etats-Unis,
-Internet Engineering Task Force (IETF) qui s'occupe des aspects architecturaux et techniques,
-Internet Society (ISOC).
Dans un but de maintenir ou d'élargir la neutralité des réseaux, mais aussi d'engager les diverses parties globales dans un dialogue sur le sujet de la gouvernance, les Nations unies ont convoqué:
-le Sommet mondial sur la société de l'information,
-le Forum sur la gouvernance de l'Internet.
La gestion des ressources numériques essentielles au fonctionnement d'Internet est confiée à l'Internet Assigned Numbers Authority (IANA), celle-ci délègue l'assignation des blocs d'adresses IP et de numéros d'Autonomous System aux registres Internet régionaux.
Neutralité du réseau
La neutralité du Net ou la neutralité du réseau est un principe fondateur d'Internet qui exclut toute discrimination à l'égard de la source, de la destination ou du contenu de l'information transmise sur le réseau.Mais de récents développements technologiques tendent à mettre fin à cette ouverture caractéristique d'Internet. C'est aujourd'hui un grand enjeu technico-économique et socio-éthique.
Aspects juridiques
Pays restreignant l'accès à Internet d'après Reporters sans frontières
Le droit d'Internet regroupe l'ensemble des règles de droit applicables au réseau Internet.
Il n'existe pas de droit spécifique à Internet, mais plutôt une application du droit commun au réseau Internet, avec cependant l'apparition d'aménagements de certaines législations nationales afin de prendre en compte ces particularités (ex: en France: la Loi pour la confiance dans l'économie numérique (LCEN) du 21 juin 2004).
Selon Benjamin Bayart, activiste pour la neutralité de réseaux, l'avis du Conseil constitutionnel rendu le 10 juin 2009 confirme qu'"Internet est essentiel à l'exercice de la liberté d'expression".
L'application du droit sur Internet est rendue difficile pour deux raisons principales:
1.Le réseau Internet est international, or le droit est généralement national.
2.sous le couvert du réseau Internet, il est souvent difficile d'identifier les utilisateurs, et donc les responsables d'infractions.
Internet soulève notamment des questions de droit relatives à la propriété intellectuelle (droit d'auteur, droit des marques, etc...), au droit de la presse et des publications (infractions de presse, injure, diffamation, incitation à la haine raciale, etc...), au droit à l'image, mais aussi depuis le développement du Web commercial, au droit de la publicité, au droit du commerce, etc....
Technique
Transit du trafic IP entre un ordinateur et un serveur. Chaque routeur oriente le trafic vers un routeur voisin plus proche de la destination
Internet est constitué de la multitude de réseaux répartis dans le monde entier et interconnectés. Chaque réseau est attaché à une entité propre (université, fournisseur d'accès à Internet, armée) et est associé à un identifiant unique appelé Autonomous System (AS) utilisé par le protocole de routage BGP. Afin de pouvoir communiquer entre eux, les réseaux s'échangent des données, soit en établissant une liaison directe, soit en se rattachant à un noeud d'échange (point de peering). Ces échanges peuvent se limiter au trafic entre leurs utilisateurs respectifs (on parle alors de peering) ou bien inclure le trafic de tiers (il s'agit alors d'accord de transit). Un opérateur qui fournit un service de transit Internet à d'autres fournisseurs d'accès est appelé carrier. Ces accords d'échange de trafic sont libres, ils ne font pas l'objet d'une régulation par une autorité centrale.
Chaque réseau est connecté à un ou plusieurs autres réseaux. Lorsque des données doivent être transmises d'un ordinateur vers un autre appartement à un AS différent, il faut déterminer le chemin à effectuer parmi les réseaux. Les routeurs chargés du trafic entre les AS disposent généralement d'une table de routage complète (Full routing table) de plus de 440 000 routes en 2013, et transmettant le trafic à un routeur voisin et plus proche de la destination après consultation de leur table de routage.
Des chercheurs israéliens de l'université Bar-Ilan ont déclaré après avoir analysé les noeuds reliant l'ensemble des sites qu'Internet est un réseau méduse. Ils la définissent comme ayant un coeur dense connectés à une multitude d'autres sites, qui ne sont reliés entre eux que par ce coeur, semblable à un maillage à structure fractale. Cette zone permet à 70% du réseau de rester connecté sans passer par le coeur. Les chercheurs indiquent donc cette zone comme piste pour désengorger le trafic, en répartissant mieux les sites de cette zone.
En pratique, ces connexions sont réalisées par des infrastructures matérielles, et des protocoles informatiques. Ces connexions permettent notamment de relier des connexions grand public à des Centre de traitement de données.
Connexions grand public
L'accès à Internet est souvent vendu sous la forme d'offre commerciale de services, avec un abonnement fixe ou un paiement aux données consommées. Certaines organisations, notamment les universités européennes, disposent de leurs propres réseaux (ex: Renater).
Pour accéder à Internet, il faut disposer d'un équipement IP ainsi qu'une connexion à un fournisseur d'accès. Pour cela, l'utilisateur emploie les matériels et logiciels suivants:
-Un ordinateur personnel ou tout autre équipement terminal d'un réseau:
.Assistant personnel,
.Console de jeux vidéo,
.Téléphone mobile,
-Un canal de communication vers le fournisseur d'accès:
.Fibre optique,
.Ligne téléphonique fixe: ligne analogique, XDSL,
.Ligne téléphonique mobile: 4G+, 3G, Edge, GPRS, GSM (CSD),
.Internet par satellite,
.Wi-Fi,
-Un système (logiciel/matériel) client pour le protocole réseau utilisé
-Un fournisseur d'accès à Internet (FAI)
Des logiciels sont eux, nécessaires pour exploiter Internet suivant les usages:
.Courrier électronique: un client SMTP et POP ou IMAP,
.Transferts de fichiers: un client ou un serveur FTP
.World Wide Web: un navigateur Web,
.Pair à pair: l'un des nombreux logiciels de P2P en fonction de l'usage (partage de fichiers en pair à pair, Calcul distribué, P2P VoIP, etc...)
Protocole réseau
Un protocole réseau est un protocole de communication mis en oeuvre sur un réseau informatique.
Il est possible que plusieurs protocoles réseau forment des couches de protocoles.
Les couches
Afin de s'y retrouver au milieu des protocoles, et même de pouvoir en changer, on les hiérarchise par exemple en quatre couches dans le modèle TCP/IP. D'autres modèles plus complexes, comme le SNA d'IBM ou le modèle de l'OSI, comptant chacun sept couches, ont rencontré moins de succès pratique et sont plutôt évoqués aujourd'hui à des fins de complétude de la théorie.
Considérée dans son ensemble, une suite de protocoles entre diverses couches forme ce qu'on nomme une pile de protocoles. Les termes "protocole" et "pile de protocoles" désignent également les logiciels qui implémentent un protocole.
Les protocoles les plus récents sont standardisés par l'IETF dans le cas des communications sur Internet, et par l'IEEE ou l'ISO pour les autres types de communication. L'UIT-T prend en charge les protocoles et les formats des télécommunications.
Dans le milieu du P2P, on considère l'ensemble des algorithmes d'un réseau comme son protocole.
Adresse IP
Une adresse IP (avec IP pour Internet Protocol) est un numéro d'identification qui est attribué de façon permanente ou provisoire à chaque appareil connecté à un réseau informatique utilisant l'Internet Protocol.
Il existe des adresses IP de version 4 (32 bits, soit 4 octets) et de version 6 (sur 128 bits, soit 16 octets). La version 4 est actuellement la plus utilisée: elle est généralement représentée en notation décimale avec 4 nombre compris entre 0 et 255, séparés par des points, ce qui donne par exemple: 212.85.150.134. Les plages d'adresses IP v4 étant proche de la saturation, les opérateurs incitent à la transition d'IPv4 vers IPv6.
Adresse IP v4
Adresse IP v6
Utilisation des adresses IP
L'adresse IP est attribuée à chaque interface avec le réseau de tout matériel informatique (routeur, ordinateur, modem ADSL, imprimante réseau, etc....) connecté à un réseau informatique utilisant l'Internet Protocol comme protocole de communication entre ses noeuds. Cette adresse est assignée soit individuellement par l'administrateur du réseau local dans le sous-réseau correspondant, soit automatiquement via le protocole DHCP. Si l'ordinateur dispose de plusieurs interfaces, chacune dispose d'une adresse IP spécifique. Une interface peut également disposer de plusieurs adresses IP.
Chaque paquet transmis par le protocole IP contient l'adresse IP de l'émetteur ainsi que l'adresse IP du destinataire. Les routeurs IP acheminent les paquets vers la destination de proche en proche. Certaines adresses IP sont utilisées pour la diffusion (multicast ou broadcast) et ne sont pas utilisables pour adresser des ordinateurs individuels.La technique anycast permet de faire correspondre une adresse IP à plusieurs ordinateurs répartis dans Internet.
Les adresses IPv4 sont dites publiques si elles sont enregistrées et routables sur Internet, elles sont donc uniques mondialement. A l'inverse, les adresses privées ne sont utilisables que dans un réseau local, et ne doivent être uniques que dans ce réseau. La traduction d'adresse réseau permet de transformer des adresses privées en adresses publiques et d'accéder à Internet d'un poste d'un réseau privé.
Adresse IP et nom de domaine
La plupart des adresses IP des serveurs peuvent être converties en un nom de domaine et inversement.Le nom de domaine est plus facilement lisible: ex fr.wikipedia.org est le nom de domaine correspondant à 91.198.174.225. Il s'agit du système de résolution de noms (DNS pour Domain Name System en anglais).
Classe d'adresse IP
Jusqu'aux années 1990, on a distingué des classes d'adresse IP qui étaient utilisées pour l'assignation des adresses et par protocoles de routage. Cette notion est désormais obsolète.
Sous-réseau
En 1984, devant la limitation du modèle de classes, la RFC 917 (Internet subnets) crée le concept de sous-réseau. Ceci permet par exemple d'utiliser une adresse de Classe B comme 256 sous-réseaux de 256 ordinateurs au lieu d'un seul réseau de 65536 ordinateurs, sans toutefois remettre en question la notion de classe d'adresse.
Le masque de sous-réseau permet de déterminer les deux parties d'une adresse IP correspondant respectivement au numéro de réseau et au numéro de l'hôte.
Un masque a la même longueur qu'une adresse IP. Il est constitué d'une suite de chiffres 1 (éventuellement) suivie par une suite de chiffres 0.
Pour calculer la partie sous-réseau d'une adresse IP, on effectue une opération ET logique bit à bit entre l'adresse et le masque. Pour calculer l'adresse de l'hôte, on effectue une opération ET bit à bit entre le complément à un du masque et l'adresse.
En IPv6, les sous-réseaux ont une taille fixe de /64, c'est-à-dire que 64 des 128 bits de l'adresse IPv6 sont réservés à la numérotation d'un hôte dans le sous-réseau.
Agrégation des adresse
En 1992, la RFC 1338 (Supernetting: an Address Assignment and Aggregation Strategy) propose d'abolir la notion de classe qui n'était plus adaptée à la taille d'Internet.
Le Classless Inter-Domain Routing (CIDR), est mis au point en 1993 afin de diminuer la taille de la table de routage contenue dans les routeurs. Pour cela, on agrège plusieurs entrée de cette table en une seule.
La distinction entre les adresses de classe A, B ou C a été ainsi rendue obsolète, de sorte que la totalité de l'espace d'adressage unicast puisse être gérée comme une collection unique de sous-réseaux indépendamment de la notion de classe. Le masque de sous-réseau ne peut plus être déduit de l'adresse IP elle-même, les protocoles de routage compatibles avec CIDR, dits classless, doivent donc accompagner les adresses du masque correspondant. C'est le cas de Border Gateway Protocol dans sa version 4, utilisé sur Internet (RFC 1654 A Border Gateway Protocol 4, 1994), OSPF, EIGRP ou RIPv2. Les registres Internet régionaux (RIR) adaptent leur politique d'attribution des adresses en conséquence de ce changement.
L'utilisation de masque de longueur variable (Variable-Length Subnet Mask, VLSM) permet le découpage de l'espace d'adressage en blocs de taille variable, permettant une utilisation plus efficace de l'espace d'adressage.
Le calcul du nombre d'adresses d'un sous-réseau est le suivant, 2 taille de l'adresse-masque.
Un fournisseur d'accès internet peut ainsi se voir allouer un bloc /19 (soit 232-19 = 213 = 8192 adresses) et créer des sous-réseaux de taille variable en fonction des besoins à l'intérieur de celui-ci: de /30 pour des liens points-à-points à /24 pour un réseau local de 200 ordinateurs. Seul le bloc /19 sera visible pour les réseaux extérieurs, ce qui réalise l'agrégation et l'efficacité dans l'utilisation des adresses.
Base de données des adresses IP
Distribution de l'espace d'adressage IPv4 en février 2011
L'IANA, qui est depuis 2005 une division de l'ICANN, définit l'usage des différentes plages d'adresses IP en segmentant l'espace en 256 blocs de taille /8, numéros de 0/8 à 255/8.
Les adresses IP unicast sont distribuées par l'IANA aux registres Internet régionaux (RIR). Les RIR gèrent les ressources d'adressage IPv4 et IPv6 dans leur région. L'espace d'adressage unicast IPv4 est composé des blocs d'adresse /8 de 1/8 à 223/8. Chacun de ces blocs est soit réservé, assigné à un réseau final ou à un registre Internet régional (RIR) ou libre. En février 2011, il ne reste plus aucun bloc /8 libre.
En IPv6, le bloc 200::/3 est réservé pour les adresses unicast globales. Des blocs /23 sont assignés au RIR depuis 1999.
Il est possible d'interroger les bases de données des RIR pour savoir à qui est assignée une adresse IP grâce à la commande whois ou via les sites web des RIR.
Les RIR se sont regroupés pour former la Number Ressource Organization (NRO) afin de coordonner leurs activités ou projets communs et mieux défendre leurs intérêts auprès de l'ICANN (l'IANA), mais aussi auprès des organismes de normalisation (notamment l'IETF ou l'ISOC).
Plages d'adresses IP spéciales
IPv4
Certaines adresses sont réservées à un usage particulier (RFC 5735):
Adresses privées
Ces adresses ne peuvent pas être routées sur Internet. Leur utilisation par un réseau privé est encouragée pour éviter de réutiliser les adresses publiques enregistrées. Il faut toutefois prévoir qu'il n'y ait pas de doublons lors de l'interconnexion de réseaux privés non prévue lors de leurs créations.
Adresses de diffusion
-L'adresse 255.255.255.255 est une adresse de diffusion
-La première adresse d'un réseau spécifie le réseau lui-même, la dernière est une adresse de diffusion (broadcast).
Adresses multicast
En IPv4, tout détenteur d'un numéro d'AS 16 bit peut utiliser un bloc de 256 adresses IP multicast, en 233.x.y.z où x et y sont les 2 octets du numéro d'AS (RFC 3180).
IPv6
Les plages d'adresses IPv6 suivantes sont réservées (RFC 5156):
Adresses spéciales
-::/128 indique une adresse non spécifiée. Celle-ci est illégale en tant qu'adresse de destination, mais elle peut être utilisée localement dans une application pour indiquer n'importe quelle interface réseau ou sur le réseau dans une phase d'acquisition de l'adresse.
Adresses locales
En IPv6, les adresses locales de site fec0::/10 étaient réservées par la RFC 3513 pour le même usage privé, mais sont considérées comme obsolètes par la RFC 3879 pour priviligier l'adressage public et décourager le recours aux NAT. Elles sont remplacée par les adresse locales uniques fc00::/7 qui facilitent l'interconnexion de réseaux privés en utilisant un identifiant aléatoire de 40 bits.
En IPv6, les adresses fe80::/64 ne sont uniques que sur un lien. Un hôte peut donc disposer de plusieurs adresses identiques dans ce réseau sur des interfaces différentes. Pour lever une ambigüité avec ces adresses de scope lien local, on devra donc préciser l'interface sur laquelle l'adresse est configurée. Sous les systèmes de type Unix, on ajoute à l'adresse le signe pourcent suivi du nom de l'interface (par exemple ff02::1%eth0), tandis que sous Windows on utilise le numéro de l'interface (ff02::1%11).
Adresses expérimentales obsolètes
-3ffe::/16 et 5f00::/8 étaient utilisés par le 6bone entre 1996 et 2006.
-::a.b.c.d/96 (où a.b.c.d est une adresse IPv4) étaient des adresses compatibles IPv4 définies dans la RFC 1884 mais rendues obsolètes par la RFC 4291 en 2006.
Epuisement des adresses IPv4
La popularité d'Internet a abouti à l'épuisement en 2011 des blocs d'adresses IPv4 disponibles, ce qui menace le développement du réseau.
Pour remédier à ce problème ou repousser l'échéance, plusieurs techniques existent:
-IPv6, dont la capacité d'adressage est considérable,
-NAT, qui permet à de nombreux ordinateurs d'un réseau privé de partager une adresse publique, mais qui complique le fonctionnement de certains protocoles,
-les registres Internet régionaux ont développé des politiques d'affectation d'adresses plus contraignantes, qui tiennent compte des besoins réels à court terme. L'affectation de blocs d'adresses plus petits diminue cependant l'efficacité de l'agrégation des adresses.
-la récupération des blocs attribués généreusement autrefois, certaines entreprises disposent ainsi d'un bloc /8, soit plus de 16 millions d'adresses publiques.
Identification par adresse IP
Celle-ci pose problème, pour plusieurs raisons:
-dans certains cas, une adresse IP publique peut être utilisée par plusieurs personnes simultanément et indépendamment,
-il est possible d'usurper l'adresse IP d'autrui dans la source d'un paquet IP dans la mesure où les routeurs utilisent normalement l'adresse destination, l'établissement d'une connexion TCP implique cependant un routage bidirectionnel correct,
-possibilité de dérouter les systèmes de traçage,
-Le traçage de l'adresse IP est souvent utilisé à des fins de marketing, et soupçonné d'influencer les politiques tarifaires.
Le FTP: File Transfer Protocol
File Transfer Protocol (protocole de transfert de fichiers), ou FTP, est un protocole de communication destiné à l'échange informatique de fichiers sur un réseau TCP/IP. Il permet, depuis un ordinateur, de copier des fichiers vers un autre ordinateur du réseau, ou encore de supprimer ou de modifier des fichiers sur cet ordinateur. Ce mécanisme de copie est souvent utilisé pour alimenter un site web hébergé chez un tiers.
La variante de FTP protégée par les protocoles SSL ou TLS (SSL étant le prédécesseur de TLS) s'appelle FTPS.
FTP obéit à un modèle client-serveur, c'est-à-dire qu'une des deux parties, le client, envoie des requêtes auxquelles réagit l'autre, appelé serveur. En pratique, le serveur est un ordinateur sur lequel fonctionne un logiciel lui-même appelé serveur FTP, qui rend publique une arborescence de fichiers similaire à un système de fichiers UNIX. Pour accéder à un serveur FTP, on utilise un logiciel client FTP (possédant une interface graphique ou en ligne de commande).
FTP, qui appartient à la couche application du modèle OSI et du modèle ARPA, utilise une connexion TCP.
Par convention, deux ports sont attribués (well know ports) pour les connexions FTP: le port 21 pour les commandes et le port 20 pour les données. Pour le FTPS dit implicite, le port conventionnel est le 990.
Ce protocole peut fonctionner avec IPv4 et IPv6.
Histoire
FTP est issu de la RFC 114 créée le 16 avril 1971. Cette spécification fut remplacée par la RFC 765 en juin 1980. Elle fut elle-même rendue obsolète par la RFC 959 en octobre 1985, version finale de la spécification.
Plusieurs RFC viennent compléter cette spécification, comme la RFC 2228 de juin 1997 pour l'ajout d'extensions de sécurité ou la RFC 2428 de septembre 1998 qui ajoute la prise en charge du protocole IPv6 et définit un nouveau type de mode passif.
Interopérabilité
Le protocole FTP ne permet pas toujours d'assurer l'interopérabilité entre plateformes différentes et régions différentes par une gestion adéquate de l'encodage des noms de fichiers. Seuls les logiciels serveur et client respectant le standard RFC 2640 en donnent la garantie, grâce à l'utilisation de l'encodage UTF-8 et accessoirement d'une nouvelle commande LANG permettant de choisir la langue des messages retournés par le serveur lors de la session FTP.L'encodage UTF-8 permet d'encoder les noms des fichiers provenant de n'importe quel pays, bien qu'un encodage plus spécifique puisse toujours être utilisé localement par le serveur, la conversion vers l'UTF-8 restant à sa discrétion.
Utilisation
Pour accéder à un serveur FTP, on utilise un client FTP, en ligne de commande ou avec une interface graphique.
Les utilisateurs de Linux ou d'un autre UNIX peuvent consulter une documentation (la plupart du temps installée par défaut) en tapant "man ftp".
La plupart des navigateurs récents autorisent les connexions FTP en utilisant une URL de type:
ftp://nom_d'utilisateur:mot_de_passe@nom_ou_adresse_du_serveur:port_ftp
En informatique anglophone on utilise login ou username pour utilisateur et passwd ou password pour mot de passe.
Par sécurité, il est conseillé de ne pas préciser le mot de passe, le serveur le demandera. Cela évite de le laisser visible dans l'historique du navigateur, mais ne change rien au fait qu'il soit transmis en clair à travers le réseau.
La partie port_ftp est optionnelle. S'il est omis le port par défaut sera utilisé.
Implémentations
Logiciels clients de FTP
Logiciels libres
-ftp (en ligne de commande sous Unix/Linux)
-Cyberduck (pour Mac OS X et Windows)
-FileZilla (pour Linux, Mac OS X et Windows)
-FireFTP (extension pour Firefox)
-gFTP (pour GNOME)
-NcFTP (Windows et systèmes de type UNIX)
-Yafc
Logiciels propriétaires
-FTP Rush (Windows 2000, Windows XP (32/64 bits), Windows 2003 (32/64 bits), Windows Vista (32/64bits), Windows 7 (32/64bits).
FTP Rush prend en charge les protocoles FTP, FXP, SFTP et TFTP. C'est un partagiciel.
-WebDrive(Windows 2000, Windows XP (32/64 bits), Windows 2003 (32/64 bits), Windows Vista (32/64 bits), Windows 7 (32/64 bits)
-CuteFTP (pour Mac OS X et Windows)
-Fetch (pour Mac OS X)
-Secure FTP Client (pour Java SE)
-Steed (pour Windows)
-Transmit (pour Mac OS X)
-Yummy FTP (pour Mac OS X)
Logiciels serveurs de FTP
Logiciels libres
-FileZilla Server
-vsftpd
-proftpd
-pure-ftpd
Logiciels propriétaires
-Titan FTP Server
Le protocole
Le protocole utilise deux types de connexions TCP:
-Une connexion de contrôle initialisée par le client, vers le serveur (port 21 en général), pour transmettre les commandes de fichiers (transfert, suppression de fichiers, renommage, liste des fichiers....)
-Une connexion de données initialisée par le client ou le serveur pour transférer les données requises (contenu des fichiers, liste de fichiers...).
-Une connexion de données initialisée par le client ou le serveur pour transférer les données requises (contenu des fichiers, liste des fichiers).
Etablissement des connexions
FTP peut s'utiliser de deux façons différentes
Mode actif:
En mode actif, c'est le client FTP qui détermine le port de connexion à utiliser pour permettre le transfert des données. Ainsi, pour que l'échange des données puisse se faire, le serveur FTP initialisera la connexion de son port de données (port 20) vers le port spécifié par le client. Le client devra alors configurer son pare-feu pour autoriser les nouvelles connexions entrantes afin que l'échange des données se fasse. De plus, il peut s'avérer problématique pour les utilisateurs essayant d'accéder à des serveurs FTP lorsque ces utilisateurs sont derrière une passerelle NAT. Etant donnée la façon dont fonctionne le NAT, le serveur FTP lance la connexion de données en se connectant à l'adresse externe de la passerelle NAT sur le port choisi. Certaines passerelles NAT n'ayant pas de correspondance pour le paquet reçu dans la table d'état, le paquet sera ignoré et ne sera pas délivré au client.
Mode passif:
En mode passif, le serveur FTP détermine lui-même le port de connexion à utiliser pour permettre le transfert des données (data connexion) et le communique au client. En cas de présence d'un pare-feu devant le serveur, celui-ci devra être configuré pour autoriser la connexion de données. L'avantage de ce mode est que le serveur FTP n'initialise aucune connexion. Ce mode fonctionne sans problèmes avec des clients derrière une passerelle NAT. Dans les nouvelles implémentations, le client initialise et communique directement par le port 21 du serveur, cela permet de simplifier les configurations des pare-feu serveur.
La connexion de contrôle
Cette connexion fonctionne en mode texte et est donc aisée à simuler avec Telnet.
Le client envoie une commande sous la forme d'une ligne de texte terminée par un retour à la ligne (CR suivi de LF, soit
Par exemple, la commande suivante demande le téléchargement du fichier "fichier.txt":
Pour exemple précédent, si le serveur trouve le fichier demandé, il envoie au client:
connexion de contrôle:
L'absence de connexions inter-réseaux
Avant la propagation des connexions inter-réseaux qui amena l'Internet actuel, la plupart des réseaux de communication étaient limités de par leur nature à des communications entre les postes du réseau. Quelques réseaux avaient des passerelles ou des ponts les reliant entre eux, mais la plupart du temps ils étaient limités ou conçus pour un usage unique. Une méthode déjà utilisée dans les réseaux de télécommunication reposait sur l'utilisation d'un ordinateur central, permettant simplement à ses terminaux d'être raccordés via de longues lignes. Cette méthode fut utilisée dans les années 1950 par le projet RAND afin de permettre la collaboration de chercheurs tels qu'Herbert Simon, alors situé à Pittsburgh en Pennsylvanie, et les chercheurs de Santa Monica en Californie, tous travaillant sur la démonstration assistée par ordinateur et l'intelligence artificielle.
Trois terminaux et une agence du Département de la Défense des Etats-Unis
Un pionnier important dans l'histoire du réseau mondial, J.C.R. Licklider, mit en avant l'idée, dans sa publication de janvier 1960, Man-Computer Symbiosis" ("La symbiose homme-ordinateur"):
« un réseau de
tels [ordinateurs], connectés les uns aux autres par des lignes de
télécommunications large bande » qui fournissait « les fonctions de
bibliothèques actuelles couplées avec les avancées faites dans le stockage et
la récupération d’information et [d’autres] fonctions symboliques. »-J.C.R. Licklider
En octobre 1962, J.C.R. Licklider fut promu à la tête du bureau de traitement de l'information de la Défense Advanced Research Projects Agency (DARPA ou ARPA) sous tutuelle du Département de la Défense des Etats-Unis, et forma un groupe informel à l'intérieur de la DARPA afin de développer la recherche informatique. Trois terminaux furent installés sous la tutelle du bureau de traitement de l'information. Un pour System Development Corporation à Santa Monica, Californie, un pour Project Genie à l'Université de Californie à Berkeley et un pour le projet Multics à l'Institut de Technologie du Massachusetts (MIT). De par les problèmes rencontrés, les besoins de création d'inter-réseaux de J.C.R. Licklider devinrent alors évidents:
Pour chacun de ces
trois terminaux, j’avais trois jeux différents de commandes. Si bien que si j’étais
en train de parler en direct avec quelqu’un chez SDC et que je voulais discuter
de ça avec quelqu’un que je connaissais à Berkeley ou au MIT, il fallait que je
me lève de devant le terminal S.D.C., que j’aille m’enregistrer sur l’autre
terminal afin d’entrer en contact avec eux.
Je me suis dit, hé,
mec, ce qu’il me reste à faire est évident : au lieu d’avoir ces trois
terminaux, il nous faut un terminal qui va partout où tu veux et où il existe
un ordinateur interactif. Cette idée était l’ARPAnet.-Robert Taylor, co-auteur
avec J.C.R.Licklider de The Computer as a Communications Device, dans un
entretien avec le New York Times.
Répartitions et aiguillages de paquets de données
Au coeur du problème de connexion inter-réseau résidait la question de connecter plusieurs réseaux physiquement séparés pour ne former qu'un seul réseau logique. Au cours des années 1960, plusieurs groupes ont travaillé sur l'élaboration de l'aiguillage de paquets (pack switching en anglais). Donald Davies (National Physical Laboratory), Paul Baran (Research and Development RAND Corporation) et Leonard Kleinrock (Massachusettes Institute of Technology) se sont vu attribuer l'invention simultanément.La notion d'Internet développé pour survivre à une attaque nucléaire trouve racine dans les premières théories développées par le RAND, mais ce n'est autre qu'une "légende urbaine" qu'aucun document officiel n'appuie. Les recherches de Paul Baran ont approché l'aiguillage de paquet par des études de décentralisation afin d'éviter que des dégradations liées à des combats puissent remettre en cause l'intégrité du réseau.
Les réseaux qui conduisirent à Internet
Le réseau ARAPNET
Promu à la tête du bureau de traitement de l'information à L'ARPA, Matt Racoon avait pour but de concrétiser les idées de J.C.R. Licklider sur les systèmes de réseaux interconnectés. En compagnie de Larry Roberts, qui travaillait au MIT, il décida de créer un tel réseau. Le premier lien ARPANET (ARPA Network) fut établi entre l'université de Californie à Los Angeles et le Stanford Research Institute le 21 novembre 1969. Dès le 5 décembre 1969, en y ajoutant l'université d'Utah et l'université de Californie à Santa Barbara, un réseau à 4 noeuds voyait le jour. A partir de 1972, le réseau (construit sur les idées développées en ALOHAnet) se développa rapidement jusqu'en 1981, date à laquelle le nombre d'hôtes s'élevait à 213 avec un rythme de croissance soutenu atteignant alors un nouvel hôte tous les 20 jours environ.
Il devint le coeur technique de ce qu'est devenu Internet, ainsi qu'un outil primaire de développement de cette nouvelle technique. Son développement fut recentré sur les processus RFC, toujours utilisés de nos jours pour proposer et distribuer les protocoles et système Internet. RFC1, dénommé "Host Softwre" (littéralement "logiciel hôte"), fut codé par Steve Crocker de l'université de Californie à Los Angeles, et publié le 7 avril 1969.
Les collaborations internationales sur le projet ARPANET restèrent rares. Pour diverses raisons politiques, les développeurs européens travaillaient sur le développement du réseau X.25. Avec quelques exceptions telles que: Norwegian Seismic Array (NORSAR) en 1972, suivi en 1973 par la Suède et sa liaison satellite entre Tanum et l'University College de Londres.
Ces premières années ont été mises en scène par Steven King dans son film documentaire de 1972 Computer Networks: The Heralds of Ressource Sharing (que l'on peut traduire par "Les Réseaux Informatiques: les prémices du partage des ressources").
X.25 et accès public
Les réseaux à ordonnance de paquets ont été développés par l'Union internationale des télécommunications en poursuivant les recherches de la DARPA et en utilisant les formes de réseau X.25. En 1974, ce dernier sert de base au développement du réseau SERCnet reliant les académiciens anglais avec leurs sites de recherche, qui deviendra par la suite JANET lors de son association avec le Joint Academic NETwork. En mars 1976 l'Union internationale des télécommunications lance le premier standard en X.25.
En 1978, le Bureau de poste anglais Western Union International, et Tymnet participèrent à la création de l'International Packet Switched Service, le premier réseau international à aiguillage de paquets. Ce réseau s'étendit depuis l'Europe et les Etats-Unis pour couvrir en 1981 le Canada, Hong Kong et l'Australie. Dès le courant des années 1990, il fournissait une infrastructure réseau mondiale.
Contrairement à l'ARPANET, le X25 était disponible dans le monde de l'entreprise. Il sera utilisé pour les premiers réseaux téléphoniques publics, tels CompuServe et Tymnet. En 1979, CompuServe fut le premier service capable de proposer un courrier électronique ainsi qu'un support technique aux utilisateurs d'ordinateurs personnels. Cette société repoussa une nouvelle fois les barrières des télécommunications en proposant l'année suivante des discussions en temps réel grâce à son CB Simulator, un simulateur radio. Il y eut aussi les réseaux America Online (AOL) et Prodigy ainsi que de nombreux réseaux bulletin board system comme The WELL et FidoNet. Ce dernier était particulièrement populaire dans le milieu des hackers et radioamateurs.
Unix to Unix Copy Protocol
En 1979, deux étudiants à l'Université Duke, Tom Truscott et Jim Ellis, ont eu l"idée d'utiliser de simples scripts en Bourne shell afin de transférer des informations et des messages en se servant d'une liaison série avec l'université voisine de Chapel Hill. En suivant les mises à jour publiques du logiciel se propageant sur l'Usenet, le réseau d'hôte Unix to Unix Copy Protocol (UUCP) se développa rapidement. UUCPnet, comme il sera nommé plus tard, entraîna la création de nombreuses passerelles et autres liens entre les hôtes FidoNet et Bulletin board system. Les réseaux UUCP se répandirent rapidement, grâce à leur coût peu élevé et leur capacité à utiliser les lignes téléphoniques existantes, comme les liens X25, et même les connexions ARPANET. Le nombre d'hôtes des réseaux UUCP était de 550 en 1983, puis 940 en 1984.
Unification des réseaux et la création d'Internet
Protocole TCP/IP
Cartographie du test du réseau TCP/IP en janvier 1982
L'abondante diversité des méthodes de communications réseau amena un besoin d'uniformisation. Robert E.Kahn recruta Vinton G.Cerf de l'université Stanford dans le but de travailler ensemble sur ce problème. En 1973, ils avaient déjà réalisé une reformulation profonde, dans laquelle les différences entre les protocoles s'estompaient par l'utilisation d'un protocole de communication: au lieu d'assoir la fiabilité du réseau sur les connexions, comme avec l'ARPANET, les hôtes en étaient maintenant responsables. Vinton G. Cerf attribua à Hubert Zimmerman et Louis Pouzin (développeurs du réseau Cyclades) un important travail de développement.
Avec le rôle du réseau physique réduit à son strict minimum, il devint alors possible de fusionner à peu près tout type de réseau sans tenir compte de leurs caractéristiques et ainsi résoudre le problème que s'était posé Robert E.Kahn à ses débuts. La DARPA accepta de financer le développement du logiciel prototype, et après plusieurs années de travail, la première démonstration quelque peu rustique de ce qu'était alors devenu le TCP/IP eut lieu en juillet 1977. Cette nouvelle méthode se répandit au travers des réseaux, et le 1er janvier 1983 les protocoles TCP/IP devenaient officiellement le seul protocole sur l'ARPANET, remplaçant le précédent protocole NCP.
Du réseau de l'ARPA à celui de la National Science Foundation
Après que l'ARPANET avait été en service pendant plusieurs années, l'agence chercha une autre entité pour prendre en charge le réseau car cela dépassait ses attributions initiales: ARPA était censé financer la recherche et le développement et non entretenir un réseau de télécommunication. Finalement en juillet 1975 le réseau passa sous la responsabilité de la Defense Communications Agency, partie intégrante du département de la Défense. En 1983 la partie de l'ARPANET appartenant aux Forces armées des Etats-Unis fut séparée du reste du réseau et devint le MILNET (Military Network)
Les réseaux construits autour de l'ARPANET étaient financés par le gouvernement et de ce fait restreints à une utilisation non commerciale et en particulier la recherche, toute utilisation commerciale sans fondement était alors strictement interdite.
Les connexions étaient initialement restreintes aux sites de l'armée et aux universités. Dans les années 1980, les connexions se sont étendues à de nombreuses institutions éducatives ainsi qu'à un nombre croissant de sociétés telles que Digital Equipment Corporation et Hewlett-Packard, qui participaient aux projets de recherche ou offraient leurs services aux connectés.
Une autre partie de l'Administration américaine, la National Science Foundation (NSF), s'impliqua largement dans la recherche et commença le développement du successeur de l'ARPANET. En 1984, ceci aboutit au premier réseau étendu conçu spécialement pour l'utilisation du TCP/IP. Celui-ci s'agrandit au travers de la dorsale Internet NSFNet, mise en place en 1986, qui avait pour but de raccorder et fournir l'accès à un nombre de centre de superordinateurs mis en place par la National Science Foundation.
Transition en vue d'un Internet
C'est à l'époque où le réseau de l'ARPA commença à fusionner avec celui de la National Science Foundation que le terme "Internet" apparut, "un internet" signifiait alors un réseau utilisant le protocole TCP/IP. "Internet" prit le sens nouveau d'un réseau mondial étendu utilisant le protocole TCP/IP, ce qui à l'époque signifiait NSFNet et ARPANET. Auparavant "internet" et "internetwork" (inter-réseau en français) étaient utilisés de manière équivalente, et "protocole internet" faisant référence aux autres systèmes réseaux comme le Xerox Network Services.
Grâce à l'intérêt grandissant pour les vastes réseaux de communication et à l'arrivée de nouvelles applications, les techniques d'Internet se propagèrent sur le reste du globe. La vision TCP/IP d'Internet se privant de réseau, amena une facilité d'utilisation de tout type de réseaux existants, tel que le réseau X25 d'IPSS, pour transporter les messages. En 1984, l'University College de Londres remplaça sa liaison transaltantique satellite par le réseau IPSS utilisant le protocole TCP/IP.
De nombreux sites incapables de se raccorder directement à Internet commencèrent la création de portails simples permettant le routage du courrier, l'application la plus importante à l'époque.Les sites possédant uniquement des connexions intermittentes utilisaient les réseaux UUCP ou FidoNet et reposaient sur les portails entre ces derniers et Internet. Certains portails allèrent au-delà du simple acheminement de courriers électroniques et proposèrent l'accès à des sites FTP via l'UUCP ou le courrier électronique.
Le protocole TCP/IP devient mondial
La première connexion sortant du territoire américain fut établie avec NORSAR en Norvège peu de temps avant le raccordement avec la Grande-Bretagne. Ces liaisons furent converties en TCP/IP en 1982, avec le reste du réseau ARPANET.
L'internet européen et le lien à travers le Pacifique
En 1984, l'Europe commença sa conversion vers une utilisation plus étendue du protocole TCP/IP, et le réseau du Conseil européen pour la recherche nucléaire ne fit pas exception. Cependant il resta isolé du reste d'Internet jusqu'en 1989.
En 1988, Daniel Karrenberg du Centrum voor Wiskunde en Informatica d'Amsterdam rendit visite à Ben Segal, coordinateur TCP/IP au CERN, il cherchait des conseils concernant la transition du réseau UUCP Usenet européen (dont la majeure partie tournait avec les liens X25) vers le TCP/IP. En 1987 Ben Segal avait rencontré Len Bosack de chez Cisco, encore une petite entreprise à l'époque, spécialisé dans les routeurs TCP/IP, il fut capable de conseiller Daniel Karrenberg et le dirigea vers Cisco pour ses besoins matériels. Ceci développa la partie européenne d'Internet au travers du réseau UUCP existant, et en 1989 le CERN ouvrit sa première connexion TCP/IP externe. Ceci coïncida avec la création du RIPE, au départ un groupe d'administrateurs de réseaux IP qui se réunissaient régulièrement pour parler de leurs travaux communs. Plus tard, en 1992, le RIPE fut formellement enregistré en tant que société coopérative à Amsterdam.
Alors que le réseau européen s'érigeait, un autre réseau voyait le jour entre ARPA et les universités australiennes (en) basé lui sur différentes techniques comme le X.25 et l'UCCPNet. Ce dernier était limité en connexion aux réseaux mondiaux de par le coût des communications individuelles via l'UCCP ou le X.25. C'est en 1989 que les universités australiennes rejoignirent l'élan d'uniformisation lancé par l'apparition du protocole IP. L'AARNet fut formé en 1989 par l'Australian Vice-Chancellors'Committee (en) et fournit une base IP dédiée au réseau australien.
Internet commença son entré en Asie à la fin des années 1980.Le Japon qui fondait en 1984 le JUNET, un réseau construit autour du réseau UUCP, se raccorda au NSFNet en 1989. Kobe reçu la rencontre annuelle de l'Internet Sociéty, baptisée INET92. Singapour développa son réseau TECHNET en 1990 la Thaïlande reçu en 1992 une connexion Internet mondiale entre l'université Chulalongkorn et l'UUNET.
Fracture numérique
Alors que les pays développés accédaient à Internet avec leurs infrastructures technologiques, les pays en développement commencèrent à souffrir d'une fracture numérique les privant d'Internet. Dans le début des années 1990, les pays africains utilisaient le X.25 et le modem 2400 bauds UUCP pour les liens internationaux et internetworks. En 1996, un projet lancé par l'agence des Etats-Unis pour le développement international, le Leland initiative commença par développer une connexion complète pour tout le continent. La Guinée, le Mozambique, Madagascar et le Rwanda reçurent des stations satellites en 1997, suivent la Côte d'Ivoire et le Bénin en 1998.
En 1991, la Chine avait un premier réseau TCP/IP, le TUNET de université Tsinghua. La Chine poursuivit et développa sa première connexion à Internet en 1994, elle reliait l'électro-spectromètre de Pékin et l'accélérateur linéaire de l'université Stanford.
Ouverture du réseau au commerce
Evolution du nombre d'hébergeurs internet de 1992 à 2006
L'intérêt pour l'utilisation commerciale d'Internet devint un sujet de débats houleux. Même si l'utilisation commerciale restait interdite, sa définition exacte pouvait être obscure et subjective. Tous étaient d'accord sur le fait qu'une entreprise envoyant une facture à une autre entreprise faisait une utilisation commerciale d'Internet, mais tout le reste était sujet à discussion. L'UUCP et le X.25 ne possédaient pas de telles restrictions qui auraient pu se concrétiser en l'interdiction d'utilisation de l'ARAPANET et du NSFN et par l'UUCP. Cependant les liens UUCP restèrent actifs et les admisitrateurs fermèrent les yeux sur leurs activités.
C'est à la fin des années 1980, que les premières entreprises fournisseur d'accès furent fondées. Des entreprises comme PSIN(en), UUNET (en), Netcom(en), et Portal Software (en) virent le jour afin d'offrir assistance aux réseaux de recherche régionaux et de fournir au particulier des accès au réseau, courriels et nouvelles-Usenet. Le premier fournisseur d'accès à Internet par le réseau téléphonique, The World ouvrit en 1989.
Ceci sema la controverse parmi les utilisateurs universitaires, qui étaient outrés à l'idée d'utiliser le réseau à des fins non éducatives. Finalement ce sont les fournisseurs d'accès qui permirent aux collèges et autres écoles d'accéder aux nouvelles aires d'éducation et de recherche par la baisse des tarifs de connexion.
En 1990 l'ARPANET fut dépassé et remplacé par des techniques plus récentes, ainsi le projet correspondant pris fin. En 1994 le NSFNet, renommé ANSNET (Advanced Networks and Service pour Réseaux avancés et service) et qui permettait l'accès aux sociétés à but non lucratif, perdit sa place d'épine dorsale d'Internet.A la fois les institutions gouvernementales et les fournisseurs créèrent leurs propres épines dorsales et liaisons. Les points d'accès régionaux au réseau (NAP en anglais) devinrent les liens principaux entre les nombreux réseaux et la dernière restriction commerciale tomba.
Maintien de l'infrastructure
L'Internet Engineering Task Force et un standard pour les standards
Internet avait engendré une communauté importante dévouée à l'idée que Internet n'appartenait et n'était régi par aucune personne, aucun groupe, aucune entreprise et aucune organisation. Cependant, des standardisations et un contrôle étaient nécessaires pour le bon fonctionnement du système.
La procédure de publication libre de RFC (Demande de commentaire en français) sema la confusion dans le système de standardisation d'Internet, et introduisit un haut degré de formalisme dans l'acceptation des standards officiels. L'IETF décida en janvier 1986 de mettre en place des réunions trimestrielles avec les chercheurs fonctionnaires. Dès la quatrième assemblée, en octobre de la même année, l'IETF convia des représentants d'organisations non gouvernementales.
L'acceptation de publication d'une RFC par RFC Editor n'implique pas automatiquement son passage en tant que standard. Elle peut être reconnue en tant que telle par l'IETF seulement après que tests, utilisation, et acceptation soient avérés et dignes d'une telle désignation.Les standards officiels sont numérotés avec un préfixe "STD", tout comme les RFC. Dans la majeure partie des cas, même après leur standardisation, elles sont appelées par leur référence RFC.
En 1992, l'Internet Society, une association de membres professionnels, fut formée et l'IETF fut mise sous sa tutelle en tant que corps de standardisation international indépendant.
Network Information Center et autres autorités de coordination
La première autorité centrale à coordonner les opérations du réseau était le Network Information Center, abrégé NIC, du Stanford Research Institute situé à Menlo Park en Californie. En 1972, la gestion de ces problèmes fut transmises à la toute récente Internet Assigned Numbers Authority, abrégée IANA. En plus de son rôle d'éditeur RFC, Jon Postel sera le patron de l'IANA jusqu'à sa mort en 1998.
Alors que le jeune ARPANET grandissait, le référencement d'hôtes se fit par noms et le fichier référence, HOST.TXT, était distribué par SRI International à tous les hôtes du réseau. Avec la croissance du réseau cette procédure devint vite fastidieuse. Une solution technique apparut sous la forme de Domain Name System (Système de nom de domaine), mis en place par Paul Mockapetris. C'est le service DDN-NIC du SRI qui prit en charge (en passant un contrat avec le ministère de la défense américain) tous les services d'enregistrement, comprenant les domaines de premier niveau (Top Level Domain-TLD), la gestion des Serveurs DNS Racine et des numéros Internet. En 1991, la Défense Information Systems Agency (DISA) transféra la gestion et la maintenance de DDN-NIC (alors prises en charge par SRI) à Government Systems Inc.,....qui le sous-traita à une petite entreprise privée Network Solutions.
Alors que la majeure partie de la croissance d'Internet venait de sources non militaires, on décida que le département de la Défense des Etats-Unis ne financerait plus les services d'enregistrement en dehors des TLD en.mil. Après une phase compétitive d'appel d'offre lancée en 1992, c'est l'année suivante que la National Science Foundation créa l'InterNic afin de gérer l'allocation et la base de donnée de l'adressage, elle passa des contrats avec trois organisations. Dorénavant les services d'enregistrement seraient assurés par Network Solutions, les services de répertoires et base de donnée par AT&T, et les services d'information par General Atomics.
En 1998, l'IANA et InterNIC furent placées sous la tutelle de l'ICANN, une association à but non lucratif californienne travaillant pour le compte du ministère du Commerce américain sur la gestion de tâches directement liées à Internet . L'opération des Serveurs DNS Racine fut privatisée et ouvert à la compétition, alors que la gestion centrale d'allocation des noms était distribuée par appel d'offres.
Utilisation et culture
Courrier électronique et Usenet: le développement de forums de texte
Le courrier électronique est souvent considéré comme la Killer application d'Internet. Même si en réalité il précéda la naissance d'Internet et fut un outil crucial pour sa création.Il vit le jour en 1965 en tant que moyen de communication entre les différents utilisateurs d'un ordinateur central à temps partagé. Même si l'histoire n'est pas très précise à ce sujet, parmi les systèmes possédant de telles ressources on compte le Q32 de chez System Development Corporation ainsi que le CTSS du Massachusetts Institute of Technology.
Le réseau d'ordinateurs ARPANET contribua largement au développement du courrier électronique. Il existe un rapport publié juste après l'apparition de l'ARPANET, qui fait référence à des échanges expérimentaux de courrier inter-systèmes. En 1971, Ray Tomlison créa ce qui devait devenir le standard du format d'adressage de courrier, en utilisant le signe @ pour séparer le nom utilisateur du nom d'hôte.
Un certain nombre de protocoles ont été développés afin de permettre le routage du courrier parmi les groupes d'ordinateurs à temps partagé en utilisant des systèmes de distribution différents comme l'UCCP et le système de courrier VNET d'IBM. Le courrier électronique pouvait ainsi passer d'un réseau à un autre (ARPANET, Bitnet et NSFNet et entre autres) et également être transmis à des hôtes qui étaient raccordés sur d'autres sites au travers de l'UCCP.
De plus, l'UCCP permettait la publication de fichiers texte pouvant être lus beaucoup d'autres.Le logiciel News, développé par Steve Daniel et Tom Truscott en 1979, fut utilisé pour l'acheminement de nouvelles et la parution de messages de type petites-annonces. Ceci dérivant vers des groupes de discussion, connus maintenant en tant que newsgroup, abordant des sujets divers et variés. Des groupes de discussion similaires apparurent sur l'ARPANET et le NSFNet au travers de mailing lists, discutant à la fois de problèmes techniques et de sujets culturels plus spécifiques (tel que la science-fiction, abordée sur la mailing list des SFlovers).
Bibliothèque mondiale: de Gopher au World Wide Web
Alors qu'Internet se développait dans les années 1980 et début 1990, le besoin grandissant de moyens de recherche et d'organisation de l'information et des fichiers se faisait ressentir. Des projets tels que Gopher, Wide Area Information Servers (WAIS) et Archie s'essayèrent à créer des solutions pour l'organisation des données distribuées. Malheureusement ces projets se heurtèrent aux difficultés de gestion des différents types de données et de croissance sans limite.
A cette période, un des paradigmes d'interface-utilisateur les plus prmotteurs était l'hypertexte. L'idée trouve son origine dans le Memex de Vannevar Bush et a été développée par Ted Nelson au travers de son Projet Xanadu ainsi que Douglas Engelbart avec le NLS. De nombreux petits systèmes hypertextes avaient été créés auparavant, tels que HyperCard d'Apple.
Tim Berners-Lee fut le premier à développer à partir de 1989 une version d'hypertexte totalement distribuée sur le réseau. Tim Berners-Lee a proposé son idée à maintes reprises et au cours de plusieurs conférences avec les communautés d'Internet et de l'hypertexte sans grand succès. Seul son collègue Robert Cailliau s'enthousiasma immédiatement. Travailleur au CERN, Tim Berners-Lee voulait mettre en place un moyen pour partager les informations sur leurs recherches. En rendant son application publique en 1991, il s'assura une diffusion mondiale. Par la suite, Gopher devint l'interface hypertexte de référence pour Internet. Bien que le menu de Gopher soit constitué de liens hypertexte, les utilisateurs ne les percevaient pas en tant que tels.
Un des premiers navigateurs Web, conçu sur la base d'HyperCard, était le populaire ViolaWWW. Il fut finalement détrôné par NCSA Mosaic, un navigateur graphique développé par une équipe du National Center for Supercomputing Applications de l'Université de l'Illinois à Urbana-Champaign (NCSA-UIUC), où Marc Andreessen était particulièrement actif. Le financement de Mosaic venait du High-Performance Computing and Communications Initiative, un programme de financement mis en place par Al Gore (sénateurà l'époque) et son High Performance Computing Act of 1991. L'interface graphique de Mosaic devint rapidement plus populaire que l'utilisation préférée d'Internet. Mosaic fut supplanté en 1994 par le Netscape Navigator, qui devint en quelques mois le navigateur le plus populaire au monde. Depuis, la concurrence avec Internet Explorer de Microsoft l'a évincé. Des anciens de Netscape développèrent Mozilla puis Firefox.Les deux principaux navigateurs actuels sont Firefox et Internet Explorer, même si on note la présence d'autres acteurs dont, par exemple, Safari, Opéra ou Chrome.
Moteur de recherche
Même avant le World Wide Web, il existait des moteurs de recherche qui essayaient d'organiser Internet. Le premier d'entre eux fut Archie de l'Université McGill de Montréal en 1990, suivi en 1991 par les WAIS et Gopher. Ces trois système existaient avant l'avènement du World Wide Web mais continuèrent à indexer Internet après son apparition. Les serveurs Gopher existaient encore en 2006.
Avec le développement du Web, des moteurs de recherche et des répertoires Internet furent créés pour permettre de trouver des informations parmi les pages Web.Le premier moteur de recherche sur Internet permettant de chercher dans le corps des pages Web fut WebCrawler en 1994. Avant lui, les recherches ne s'effectuaient que sur les titres des pages. Un autre moteur de recherche fut créé en 1993 en tant que projet universitaire: Lycos. Il était alors un des premiers succès commerciaux. En janvier 1999, Google référençait plus de 60 millions de pages et la croissance a continué depuis, même si la vraie avancée ne se fit pas tant en termes de taille de base de données, que sur le classement en degré de pertinence, les méthodes avec lesquelles les moteurs de recherche essayent d'ordonner les résultats de telle sorte que le meilleur soit en premier.
Ces algorithmes de classification n'ont pas cessé de s'améliorer depuis 1996, lorsque cela devint critique à cause de la croissance rapide de la toile qui rendit toute recherche fastidieuse par le nombre important de résultats renvoyés. En 2006, les méthodes d'ordonnancement sont plus importantes que jamais, étant donné que parcourir une liste entière de résultats est non seulement peu commode mais humainement impossible, en effet les pages traitant de sujets populaires apparaissent sur la toile trop vite pour que n'importe qui puisse les lire toutes. La méthode PageRank de Google pour l'ordonnancement des résultats est celle qui a reçu les meilleures critiques, cependant tous les grands moteurs de recherche affinent continuellement leurs méthodes afin d'améliorer le classement des résultats.
Internet
Internautes par millier d'habitants dans le monde en 2009
Internet est un système d'interconnexion de machine et constitue un réseau informatique mondial, utilisant un ensemble standardisé de protocoles de transfert de données. C'est donc un réseau de réseaux, sans centre névralgique, composé de millions de réseaux aussi bien publics que privés, universitaires, commerciaux et gouvernementaux. Internet transporte un large spectre d'information et permet l'élaboration d'applications et de services variés comme le courrier électronique, la messagerie instantanée et le World Wide Web.
Internet ayant été popularisé par l'apparition du World Wide Web, les deux sont parfois confondus par le public non averti. Le World Wide Web n'est pourtant que l'une des applications d'Internet.
L'accès à Internet peut être obtenu grâce à un fournisseur d'accès à Internet via divers moyens de communication électronique: soit filaire (réseau téléphonique commuté (bas débit), ADSL, fibre optique jusqu'au domicile), soit sans fil (WiMAX, par satellite, 3G+). Un utilisateur d'Internet est désigné par le néologisme "internaute".
Visualisation des multiples chemins à travers une portion d'Internet
Terminologie
Le terme d'origine américaine "Internet" est dérivé du concept d'internetting (en français: "interconnecter des réseaux") dont la première utilisation documentée remonte à octobre 1972 par Robert E.Kahn au cours de la première ICCC (International Conference on Computer Communications) à Washington.
Les origines exactes du terme Internet restent à déterminer. Toutefois, c'est le 1er janvier 1983 que le nom "Internet", déjà en usage pour désigner l'ensemble d'ARPANET et plusieurs réseaux informatiques, est devenu officiel.
En anglais, on utilise un article défini et une majuscule, ce qui donne the Internet. Cet usage vient du fait que "Internet" est de loin le réseau le plus étendu, le plus grand "internet" du monde, et donc, en tant qu'objet unique, désigné par un nom propre. Un internet (un nom commun avec "i" minuscule) est un terme d'origine anglaise utilisé pour désigner un réseau constitué de l'interconnexion de plusieurs réseaux informatiques au moyen de routeurs.
Une publication au Journal officiel de la République française indique qu'il faut utiliser le mot "internet" comme un nom commun, c'est-à-dire sans majuscule. L'Académie française recommande de dire "l'Internet". Il existe une controverse sur le sujet entre les partisans des expressions "l'Internet", "l'Internet", "Internet" et "internet".
Historique
Les mémos que Licklider du Massachussetts Institute of Technology (MIT) écrivit en juillet 1962 sont les plus anciens textes décrivant les interactions sociales qui seraient possibles avec un réseau d'ordinateurs. Cela devait notamment faciliter les communications entre chercheurs de la Défense Advanced Research Projects Agency (DARPA). En octobre 1962, Licklider fut le premier chef du programme de recherche en informatique de la DARPA. En octobre 1962, Licklider fut le premier chef du programme de recherche en informatique de la DARPA. Il persuada ses successeurs Ivan Sutherland, Bob Taylor et le chercheur du MIT Lawrence G.Roberts de l'intérêt des réseaux informatiques.
En 1961, Leonard Kleinrock du MIT publia le premier texte théorique sur les télécommunications par paquets et en 1964 il publia le premier livre sur le sujet.
En 1965, Roberts testa avec Thomas Merrill la première connexion informatique à longue distance, entre le Massachusetts et la Californie. Le résultat montra que des ordinateurs pouvaient travailler ensemble à distance, mais que le mode de télécommunication par établissement de circuit du système téléphonique était inadapté. Le concept de communication par paquets de Kleinrock s'imposa.
En 1966, Roberts fut engagé par Taylor à la DARPA pour concevoir l'ARPANET. Il publia les plans en 1967. En présentant ce texte, il découvrit deux autres groupes de chercheurs travaillant indépendamment sur le même sujet: un groupe du National Physical Laboratory (NPL) du Royaume-Uni avec Donald Davies et Roger Scantlebury, et un groupe de la RAND Corporation avec Paul Baran.
Entre 1962 et 1965, le groupe de la RAND avait étudié la transmission par paquets pour l'armée américaine. Le but était de pouvoir maintenir les télécommunications en cas d'attaque (éventuellement nucléaire), ce que permet une transmission par paquets dans un réseau non centralisé. Il s'agissait d'un développement indépendant d'ARPANET: bien que probablement robuste face à une telle attaque, ARPANET n'a pourtant été conçu que pour faciliter les télécommunications entre chercheurs. Le rapport de Paul Baran est resté purement théorique, et est rapidement tombé dans l'oubli. Mais le mythe d'"ARPANET comme dernier rempart à une attaque atomique" trouve là son origine.
Pendant ce temps, au British National Physical Laboratory, l'équipe de Donald Davies avait progressé: NPL Network, le premier réseau maillé fondé sur la transmission de datagrammes (packets) était fonctionnel. Mais l'histoire d'Internet n'a pas été écrite par les Européens: ARPANET sera désormais l'origine officielle d'Internet.
En août 1968, la DARPA accepta de financer le développement du matériel de routage des paquets d'ARPANET. Ce développement fut confié en décembre à un groupe de la firme Bolt, Beranek and Newman (BBN) de Boston. Ce dernier travailla avec Bob Kahn sur l'architecture du réseau. Roberts améliorait les aspects topologiques et économiques du réseau. Kleinrock préparait des systèmes de mesures du réseau.
Le 20 septembre 1969, BBN installa le premier équipement à l'UCLA où travaillait Kleinrock. Le second noeud du réseau fut installé au Stanford Research Institute (SRI) où travaillait Douglas Engelbart sur un projet d'hypertexte. Deux noeuds supplémentaires furent ajoutés avec l'université de Santa Barbara et l'université d'Utah. Fin 1969, ARPANET comptait donc quatre noeuds.
Le Network Working Group (NWG) conduit par Steve Crocker finit le protocole de communication poste-à-poste NCP en décembre 1970. Ce protocole fut adopté entre 1971 et 1972 par les sites branchés à ARPANET. Ceci permit le développement d'applications par les utilisateurs du réseau.
En 1972, Ray Tomlinson mit au point la première application importante: le courrier électronique. En octobre 1972, Kahn organisa la première démonstration à grande échelle d'ARPANET à l'International Computer Communication Conférence (ICCC). C'était la première démonstration publique.
Le concept d'Internet est né d'ARPANET. L'idée était de permettre la connexion entre les réseaux divers: ARPANET, des communications avec les satellites, des communications par radio. Cette idée fut introduite par Kahn en 1972 sous le nom de Internetting. Le protocole NCP d'ARPANET ne permettait pas d'adresser des hôtes hors d'ARPANET ni de corriger d'éventuelles erreurs de transmission. Kahn décida donc de développer un nouveau protocole, qui devint finalement TCP/IP.
En parallèle, un projet inspiré par ARPANET était dirigé en France par Louis Pouzin: le projet Cyclades. De nombreuses propriétés de TCP/IP ont ainsi été développées, plus tôt, pour Cyclades. Pouzin et Kahn indiquent que TCP/IP a été inspiré par Cyclades.
En 1973, Kahn demanda à Vint Cerf (parfois appelé le père d'Internet) de travailler avec lui, car Cerf connaissait les détails de mise en oeuvre de NCP. Le premier document faisant référence à TCP est écrit en 1973 par Cerf: A Partial Specification of an International Transmission Protocol. La première spécification formelle de TCP date de décembre 1974, c'est le RFC675.
La version initiale de TCP ne permettait que la communication en établissant un circuit virtuel. Cela fonctionnait bien pour le transfert de fichiers ou le travail à distance, mais n'était pas adapté à des applications comme la téléphonie par Internet. TCP fut donc séparé de IP et UDP proposé pour les transmissions sans établissement d'un circuit.
A la fin des années 1980, la NSF (National Science Foundation) qui dépend de l'administration américaine, met en place cinq centres informatiques surpuissants, auxquels les utilisateurs pouvaient se connecter, quel que soit le lieu où ils se trouvaient aux Etats-Unis: ARPANET devenait ainsi accessible sur une plus grande échelle. Le système rencontra un franc succès et, après la mise à niveau importante (matériels et lignes) à la fin des années 1980, s'ouvrit au trafic commercial au début des années 1990.
Le début des années 1990 marque, en fait, la naissance de l'aspect le plus connu d'Internet aujourd'hui: le web, un ensemble de pages en HTML mélangeant du texte, des liens, des images, adressables via une URL et accessibles via le protocole HTTP. Ces standards, développés au CERN par Tim-Berners-Lee et Robert Cailliau devinrent rapidement populaires grâce au développement au NCSA par Marc Andreessen et Eric Bina du premier navigateur multimédia Mosaic.
En janvier 1992, l'Internet Society (ISOC) voit le jour avec pour objectif de promouvoir et de coordonner les développements sur Internet. L'année 1993 voit l'application du premier navigateur web ou butineur (browser), supportant le texte et les images. Cette même année, la National Science Foundation (NSF) mandate une compagnie pour enregistrer les noms de domaine.
Gouvernance
Nombre d'utilisateurs par pays en 2006
Selon la définition du groupe de travail sur la gouvernance d'Internet, il faut entendre par "gouvernance de l'Internet" l'élaboration et l'application par les Etats, le secteur privé et la société civile, dans le cadre de leurs rôles respectifs, de principes, normes, règles, procédures de prise de décisions et programmes communs propres à modeler l'évolution et l'usage de l'Internet.
Les registres de métadonnées sont importants dans l'établissement de règles d'accès aux ressources web qui utilisent les Uniform Ressource Identifiers (qui peuvent être les URL qui s'affichent sur la barre de navigation de l'ordinateur personnel).
Un certain nombre d'organismes sont chargés de la gestion d'Internet, avec des attributions spécifiques. Ils participent à l'élaboration des standards techniques, l'attribution des noms de domaines, des adresses IP, etc...:
-Internet Corporation for Assigned Names and Numbers (ICANN), sous la tutelle du Département du Commerce des Etats-Unis,
-Internet Engineering Task Force (IETF) qui s'occupe des aspects architecturaux et techniques,
-Internet Society (ISOC).
Dans un but de maintenir ou d'élargir la neutralité des réseaux, mais aussi d'engager les diverses parties globales dans un dialogue sur le sujet de la gouvernance, les Nations unies ont convoqué:
-le Sommet mondial sur la société de l'information,
-le Forum sur la gouvernance de l'Internet.
La gestion des ressources numériques essentielles au fonctionnement d'Internet est confiée à l'Internet Assigned Numbers Authority (IANA), celle-ci délègue l'assignation des blocs d'adresses IP et de numéros d'Autonomous System aux registres Internet régionaux.
Neutralité du réseau
La neutralité du Net ou la neutralité du réseau est un principe fondateur d'Internet qui exclut toute discrimination à l'égard de la source, de la destination ou du contenu de l'information transmise sur le réseau.Mais de récents développements technologiques tendent à mettre fin à cette ouverture caractéristique d'Internet. C'est aujourd'hui un grand enjeu technico-économique et socio-éthique.
Aspects juridiques
Pays restreignant l'accès à Internet d'après Reporters sans frontières
Le droit d'Internet regroupe l'ensemble des règles de droit applicables au réseau Internet.
Il n'existe pas de droit spécifique à Internet, mais plutôt une application du droit commun au réseau Internet, avec cependant l'apparition d'aménagements de certaines législations nationales afin de prendre en compte ces particularités (ex: en France: la Loi pour la confiance dans l'économie numérique (LCEN) du 21 juin 2004).
Selon Benjamin Bayart, activiste pour la neutralité de réseaux, l'avis du Conseil constitutionnel rendu le 10 juin 2009 confirme qu'"Internet est essentiel à l'exercice de la liberté d'expression".
L'application du droit sur Internet est rendue difficile pour deux raisons principales:
1.Le réseau Internet est international, or le droit est généralement national.
2.sous le couvert du réseau Internet, il est souvent difficile d'identifier les utilisateurs, et donc les responsables d'infractions.
Internet soulève notamment des questions de droit relatives à la propriété intellectuelle (droit d'auteur, droit des marques, etc...), au droit de la presse et des publications (infractions de presse, injure, diffamation, incitation à la haine raciale, etc...), au droit à l'image, mais aussi depuis le développement du Web commercial, au droit de la publicité, au droit du commerce, etc....
Technique
Transit du trafic IP entre un ordinateur et un serveur. Chaque routeur oriente le trafic vers un routeur voisin plus proche de la destination
Internet est constitué de la multitude de réseaux répartis dans le monde entier et interconnectés. Chaque réseau est attaché à une entité propre (université, fournisseur d'accès à Internet, armée) et est associé à un identifiant unique appelé Autonomous System (AS) utilisé par le protocole de routage BGP. Afin de pouvoir communiquer entre eux, les réseaux s'échangent des données, soit en établissant une liaison directe, soit en se rattachant à un noeud d'échange (point de peering). Ces échanges peuvent se limiter au trafic entre leurs utilisateurs respectifs (on parle alors de peering) ou bien inclure le trafic de tiers (il s'agit alors d'accord de transit). Un opérateur qui fournit un service de transit Internet à d'autres fournisseurs d'accès est appelé carrier. Ces accords d'échange de trafic sont libres, ils ne font pas l'objet d'une régulation par une autorité centrale.
Chaque réseau est connecté à un ou plusieurs autres réseaux. Lorsque des données doivent être transmises d'un ordinateur vers un autre appartement à un AS différent, il faut déterminer le chemin à effectuer parmi les réseaux. Les routeurs chargés du trafic entre les AS disposent généralement d'une table de routage complète (Full routing table) de plus de 440 000 routes en 2013, et transmettant le trafic à un routeur voisin et plus proche de la destination après consultation de leur table de routage.
Des chercheurs israéliens de l'université Bar-Ilan ont déclaré après avoir analysé les noeuds reliant l'ensemble des sites qu'Internet est un réseau méduse. Ils la définissent comme ayant un coeur dense connectés à une multitude d'autres sites, qui ne sont reliés entre eux que par ce coeur, semblable à un maillage à structure fractale. Cette zone permet à 70% du réseau de rester connecté sans passer par le coeur. Les chercheurs indiquent donc cette zone comme piste pour désengorger le trafic, en répartissant mieux les sites de cette zone.
En pratique, ces connexions sont réalisées par des infrastructures matérielles, et des protocoles informatiques. Ces connexions permettent notamment de relier des connexions grand public à des Centre de traitement de données.
Connexions grand public
L'accès à Internet est souvent vendu sous la forme d'offre commerciale de services, avec un abonnement fixe ou un paiement aux données consommées. Certaines organisations, notamment les universités européennes, disposent de leurs propres réseaux (ex: Renater).
Pour accéder à Internet, il faut disposer d'un équipement IP ainsi qu'une connexion à un fournisseur d'accès. Pour cela, l'utilisateur emploie les matériels et logiciels suivants:
-Un ordinateur personnel ou tout autre équipement terminal d'un réseau:
.Assistant personnel,
.Console de jeux vidéo,
.Téléphone mobile,
-Un canal de communication vers le fournisseur d'accès:
.Fibre optique,
.Ligne téléphonique fixe: ligne analogique, XDSL,
.Ligne téléphonique mobile: 4G+, 3G, Edge, GPRS, GSM (CSD),
.Internet par satellite,
.Wi-Fi,
-Un système (logiciel/matériel) client pour le protocole réseau utilisé
-Un fournisseur d'accès à Internet (FAI)
Des logiciels sont eux, nécessaires pour exploiter Internet suivant les usages:
.Courrier électronique: un client SMTP et POP ou IMAP,
.Transferts de fichiers: un client ou un serveur FTP
.World Wide Web: un navigateur Web,
.Pair à pair: l'un des nombreux logiciels de P2P en fonction de l'usage (partage de fichiers en pair à pair, Calcul distribué, P2P VoIP, etc...)
Protocole réseau
Un protocole réseau est un protocole de communication mis en oeuvre sur un réseau informatique.
Il est possible que plusieurs protocoles réseau forment des couches de protocoles.
Les couches
Afin de s'y retrouver au milieu des protocoles, et même de pouvoir en changer, on les hiérarchise par exemple en quatre couches dans le modèle TCP/IP. D'autres modèles plus complexes, comme le SNA d'IBM ou le modèle de l'OSI, comptant chacun sept couches, ont rencontré moins de succès pratique et sont plutôt évoqués aujourd'hui à des fins de complétude de la théorie.
Considérée dans son ensemble, une suite de protocoles entre diverses couches forme ce qu'on nomme une pile de protocoles. Les termes "protocole" et "pile de protocoles" désignent également les logiciels qui implémentent un protocole.
Les protocoles les plus récents sont standardisés par l'IETF dans le cas des communications sur Internet, et par l'IEEE ou l'ISO pour les autres types de communication. L'UIT-T prend en charge les protocoles et les formats des télécommunications.
Dans le milieu du P2P, on considère l'ensemble des algorithmes d'un réseau comme son protocole.
Adresse IP
Une adresse IP (avec IP pour Internet Protocol) est un numéro d'identification qui est attribué de façon permanente ou provisoire à chaque appareil connecté à un réseau informatique utilisant l'Internet Protocol.
Il existe des adresses IP de version 4 (32 bits, soit 4 octets) et de version 6 (sur 128 bits, soit 16 octets). La version 4 est actuellement la plus utilisée: elle est généralement représentée en notation décimale avec 4 nombre compris entre 0 et 255, séparés par des points, ce qui donne par exemple: 212.85.150.134. Les plages d'adresses IP v4 étant proche de la saturation, les opérateurs incitent à la transition d'IPv4 vers IPv6.
Adresse IP v4
Adresse IP v6
Utilisation des adresses IP
L'adresse IP est attribuée à chaque interface avec le réseau de tout matériel informatique (routeur, ordinateur, modem ADSL, imprimante réseau, etc....) connecté à un réseau informatique utilisant l'Internet Protocol comme protocole de communication entre ses noeuds. Cette adresse est assignée soit individuellement par l'administrateur du réseau local dans le sous-réseau correspondant, soit automatiquement via le protocole DHCP. Si l'ordinateur dispose de plusieurs interfaces, chacune dispose d'une adresse IP spécifique. Une interface peut également disposer de plusieurs adresses IP.
Chaque paquet transmis par le protocole IP contient l'adresse IP de l'émetteur ainsi que l'adresse IP du destinataire. Les routeurs IP acheminent les paquets vers la destination de proche en proche. Certaines adresses IP sont utilisées pour la diffusion (multicast ou broadcast) et ne sont pas utilisables pour adresser des ordinateurs individuels.La technique anycast permet de faire correspondre une adresse IP à plusieurs ordinateurs répartis dans Internet.
Les adresses IPv4 sont dites publiques si elles sont enregistrées et routables sur Internet, elles sont donc uniques mondialement. A l'inverse, les adresses privées ne sont utilisables que dans un réseau local, et ne doivent être uniques que dans ce réseau. La traduction d'adresse réseau permet de transformer des adresses privées en adresses publiques et d'accéder à Internet d'un poste d'un réseau privé.
Adresse IP et nom de domaine
La plupart des adresses IP des serveurs peuvent être converties en un nom de domaine et inversement.Le nom de domaine est plus facilement lisible: ex fr.wikipedia.org est le nom de domaine correspondant à 91.198.174.225. Il s'agit du système de résolution de noms (DNS pour Domain Name System en anglais).
Classe d'adresse IP
Jusqu'aux années 1990, on a distingué des classes d'adresse IP qui étaient utilisées pour l'assignation des adresses et par protocoles de routage. Cette notion est désormais obsolète.
Sous-réseau
En 1984, devant la limitation du modèle de classes, la RFC 917 (Internet subnets) crée le concept de sous-réseau. Ceci permet par exemple d'utiliser une adresse de Classe B comme 256 sous-réseaux de 256 ordinateurs au lieu d'un seul réseau de 65536 ordinateurs, sans toutefois remettre en question la notion de classe d'adresse.
Le masque de sous-réseau permet de déterminer les deux parties d'une adresse IP correspondant respectivement au numéro de réseau et au numéro de l'hôte.
Un masque a la même longueur qu'une adresse IP. Il est constitué d'une suite de chiffres 1 (éventuellement) suivie par une suite de chiffres 0.
Pour calculer la partie sous-réseau d'une adresse IP, on effectue une opération ET logique bit à bit entre l'adresse et le masque. Pour calculer l'adresse de l'hôte, on effectue une opération ET bit à bit entre le complément à un du masque et l'adresse.
En IPv6, les sous-réseaux ont une taille fixe de /64, c'est-à-dire que 64 des 128 bits de l'adresse IPv6 sont réservés à la numérotation d'un hôte dans le sous-réseau.
Agrégation des adresse
En 1992, la RFC 1338 (Supernetting: an Address Assignment and Aggregation Strategy) propose d'abolir la notion de classe qui n'était plus adaptée à la taille d'Internet.
Le Classless Inter-Domain Routing (CIDR), est mis au point en 1993 afin de diminuer la taille de la table de routage contenue dans les routeurs. Pour cela, on agrège plusieurs entrée de cette table en une seule.
La distinction entre les adresses de classe A, B ou C a été ainsi rendue obsolète, de sorte que la totalité de l'espace d'adressage unicast puisse être gérée comme une collection unique de sous-réseaux indépendamment de la notion de classe. Le masque de sous-réseau ne peut plus être déduit de l'adresse IP elle-même, les protocoles de routage compatibles avec CIDR, dits classless, doivent donc accompagner les adresses du masque correspondant. C'est le cas de Border Gateway Protocol dans sa version 4, utilisé sur Internet (RFC 1654 A Border Gateway Protocol 4, 1994), OSPF, EIGRP ou RIPv2. Les registres Internet régionaux (RIR) adaptent leur politique d'attribution des adresses en conséquence de ce changement.
L'utilisation de masque de longueur variable (Variable-Length Subnet Mask, VLSM) permet le découpage de l'espace d'adressage en blocs de taille variable, permettant une utilisation plus efficace de l'espace d'adressage.
Le calcul du nombre d'adresses d'un sous-réseau est le suivant, 2 taille de l'adresse-masque.
Un fournisseur d'accès internet peut ainsi se voir allouer un bloc /19 (soit 232-19 = 213 = 8192 adresses) et créer des sous-réseaux de taille variable en fonction des besoins à l'intérieur de celui-ci: de /30 pour des liens points-à-points à /24 pour un réseau local de 200 ordinateurs. Seul le bloc /19 sera visible pour les réseaux extérieurs, ce qui réalise l'agrégation et l'efficacité dans l'utilisation des adresses.
Base de données des adresses IP
Distribution de l'espace d'adressage IPv4 en février 2011
L'IANA, qui est depuis 2005 une division de l'ICANN, définit l'usage des différentes plages d'adresses IP en segmentant l'espace en 256 blocs de taille /8, numéros de 0/8 à 255/8.
Les adresses IP unicast sont distribuées par l'IANA aux registres Internet régionaux (RIR). Les RIR gèrent les ressources d'adressage IPv4 et IPv6 dans leur région. L'espace d'adressage unicast IPv4 est composé des blocs d'adresse /8 de 1/8 à 223/8. Chacun de ces blocs est soit réservé, assigné à un réseau final ou à un registre Internet régional (RIR) ou libre. En février 2011, il ne reste plus aucun bloc /8 libre.
En IPv6, le bloc 200::/3 est réservé pour les adresses unicast globales. Des blocs /23 sont assignés au RIR depuis 1999.
Il est possible d'interroger les bases de données des RIR pour savoir à qui est assignée une adresse IP grâce à la commande whois ou via les sites web des RIR.
Les RIR se sont regroupés pour former la Number Ressource Organization (NRO) afin de coordonner leurs activités ou projets communs et mieux défendre leurs intérêts auprès de l'ICANN (l'IANA), mais aussi auprès des organismes de normalisation (notamment l'IETF ou l'ISOC).
Plages d'adresses IP spéciales
IPv4
Certaines adresses sont réservées à un usage particulier (RFC 5735):
Bloc
|
Usage
|
Référence
|
0.0.0.0./8
|
Adresse réseau
par défaut
|
RFC 1700
|
10.0.0.0/8
|
Adresses privées
|
RFC 1918
|
100.64.0.0/10
|
Espace partagé
pour Carrier Grade NAT
|
RFC 6598
|
127.0.0.0/8
|
Adresse de
bouclage (localhost)
|
RFC 1122
|
169.254.0.0/16
|
Adresses privées
|
RFC 1918
|
192.0.0.0/24
|
Réservé par l’IETF
|
RFC 5736
|
192.0.2.0/24
|
Réseau de test
TEST-NET-1
|
RFC 5737
|
192.88.99.0/24
|
6to4 anycast
|
RFC 3068
|
192.168.0.0/16
|
Adresses privées
|
RFC 1918
|
198.18.0.0/15
|
Tests de
performance
|
RFC 2544
|
198.51.100.0/24
|
Réseau de test
TEST-NET-2
|
RFC 5737
|
203.0.113.0/24
|
Réseau de test
TEST-NET-3
|
RFC 5737
|
224.0.0.0/4
|
Multicast
|
RFC 5771
|
240.0.0.0/4
|
Réservé à un
usage ultérieur non précisé
|
RFC 1112
|
255.255.255.255/32
|
Broadcast limité
|
RFC 919
|
Adresses privées
Ces adresses ne peuvent pas être routées sur Internet. Leur utilisation par un réseau privé est encouragée pour éviter de réutiliser les adresses publiques enregistrées. Il faut toutefois prévoir qu'il n'y ait pas de doublons lors de l'interconnexion de réseaux privés non prévue lors de leurs créations.
Adresses de diffusion
-L'adresse 255.255.255.255 est une adresse de diffusion
-La première adresse d'un réseau spécifie le réseau lui-même, la dernière est une adresse de diffusion (broadcast).
Adresses multicast
En IPv4, tout détenteur d'un numéro d'AS 16 bit peut utiliser un bloc de 256 adresses IP multicast, en 233.x.y.z où x et y sont les 2 octets du numéro d'AS (RFC 3180).
IPv6
Les plages d'adresses IPv6 suivantes sont réservées (RFC 5156):
Bloc
|
Usage
|
Référence
|
::/128
|
Adresse non
spécifié
|
RFC 4291
|
::1/128
|
Adresse de
bouclage
|
RFC 4291
|
::ffff :0 :0/96
|
Adresse IPv6
mappant IPv4
|
RFC 4291
|
0100 ::/64
|
Sollicitation de
trou noir
|
RFC 6666
|
2000 ::/3
|
Adresses
unicast routables sur Internet
|
RFC 3587
|
2001 ::/32
|
Teredo
|
RFC 4380
|
2001 :2 ::/48
|
Tests de
performance
|
RFC 5180
|
2001 :10 ::/28
|
Orchid
|
RFC 4843
|
2001 :db8 ::/32
|
Documentation
|
RFC 3849
|
2002 ::/16
|
6to4
|
RFC 3056
|
Fc00 ::/7
|
Adresses locales
uniques
|
RFC 4193
|
Fe80 ::/10
|
Adresses locales
lien
|
RFC 4291
|
Ff00 ::/8
|
Adresses multicast
|
RFC 4291
|
Adresses spéciales
-::/128 indique une adresse non spécifiée. Celle-ci est illégale en tant qu'adresse de destination, mais elle peut être utilisée localement dans une application pour indiquer n'importe quelle interface réseau ou sur le réseau dans une phase d'acquisition de l'adresse.
Adresses locales
En IPv6, les adresses locales de site fec0::/10 étaient réservées par la RFC 3513 pour le même usage privé, mais sont considérées comme obsolètes par la RFC 3879 pour priviligier l'adressage public et décourager le recours aux NAT. Elles sont remplacée par les adresse locales uniques fc00::/7 qui facilitent l'interconnexion de réseaux privés en utilisant un identifiant aléatoire de 40 bits.
En IPv6, les adresses fe80::/64 ne sont uniques que sur un lien. Un hôte peut donc disposer de plusieurs adresses identiques dans ce réseau sur des interfaces différentes. Pour lever une ambigüité avec ces adresses de scope lien local, on devra donc préciser l'interface sur laquelle l'adresse est configurée. Sous les systèmes de type Unix, on ajoute à l'adresse le signe pourcent suivi du nom de l'interface (par exemple ff02::1%eth0), tandis que sous Windows on utilise le numéro de l'interface (ff02::1%11).
Adresses expérimentales obsolètes
-3ffe::/16 et 5f00::/8 étaient utilisés par le 6bone entre 1996 et 2006.
-::a.b.c.d/96 (où a.b.c.d est une adresse IPv4) étaient des adresses compatibles IPv4 définies dans la RFC 1884 mais rendues obsolètes par la RFC 4291 en 2006.
Epuisement des adresses IPv4
La popularité d'Internet a abouti à l'épuisement en 2011 des blocs d'adresses IPv4 disponibles, ce qui menace le développement du réseau.
Pour remédier à ce problème ou repousser l'échéance, plusieurs techniques existent:
-IPv6, dont la capacité d'adressage est considérable,
-NAT, qui permet à de nombreux ordinateurs d'un réseau privé de partager une adresse publique, mais qui complique le fonctionnement de certains protocoles,
-les registres Internet régionaux ont développé des politiques d'affectation d'adresses plus contraignantes, qui tiennent compte des besoins réels à court terme. L'affectation de blocs d'adresses plus petits diminue cependant l'efficacité de l'agrégation des adresses.
-la récupération des blocs attribués généreusement autrefois, certaines entreprises disposent ainsi d'un bloc /8, soit plus de 16 millions d'adresses publiques.
Identification par adresse IP
Celle-ci pose problème, pour plusieurs raisons:
-dans certains cas, une adresse IP publique peut être utilisée par plusieurs personnes simultanément et indépendamment,
-il est possible d'usurper l'adresse IP d'autrui dans la source d'un paquet IP dans la mesure où les routeurs utilisent normalement l'adresse destination, l'établissement d'une connexion TCP implique cependant un routage bidirectionnel correct,
-possibilité de dérouter les systèmes de traçage,
-Le traçage de l'adresse IP est souvent utilisé à des fins de marketing, et soupçonné d'influencer les politiques tarifaires.
Le FTP: File Transfer Protocol
File Transfer Protocol (protocole de transfert de fichiers), ou FTP, est un protocole de communication destiné à l'échange informatique de fichiers sur un réseau TCP/IP. Il permet, depuis un ordinateur, de copier des fichiers vers un autre ordinateur du réseau, ou encore de supprimer ou de modifier des fichiers sur cet ordinateur. Ce mécanisme de copie est souvent utilisé pour alimenter un site web hébergé chez un tiers.
La variante de FTP protégée par les protocoles SSL ou TLS (SSL étant le prédécesseur de TLS) s'appelle FTPS.
FTP obéit à un modèle client-serveur, c'est-à-dire qu'une des deux parties, le client, envoie des requêtes auxquelles réagit l'autre, appelé serveur. En pratique, le serveur est un ordinateur sur lequel fonctionne un logiciel lui-même appelé serveur FTP, qui rend publique une arborescence de fichiers similaire à un système de fichiers UNIX. Pour accéder à un serveur FTP, on utilise un logiciel client FTP (possédant une interface graphique ou en ligne de commande).
FTP, qui appartient à la couche application du modèle OSI et du modèle ARPA, utilise une connexion TCP.
Par convention, deux ports sont attribués (well know ports) pour les connexions FTP: le port 21 pour les commandes et le port 20 pour les données. Pour le FTPS dit implicite, le port conventionnel est le 990.
Ce protocole peut fonctionner avec IPv4 et IPv6.
Histoire
FTP est issu de la RFC 114 créée le 16 avril 1971. Cette spécification fut remplacée par la RFC 765 en juin 1980. Elle fut elle-même rendue obsolète par la RFC 959 en octobre 1985, version finale de la spécification.
Plusieurs RFC viennent compléter cette spécification, comme la RFC 2228 de juin 1997 pour l'ajout d'extensions de sécurité ou la RFC 2428 de septembre 1998 qui ajoute la prise en charge du protocole IPv6 et définit un nouveau type de mode passif.
Interopérabilité
Le protocole FTP ne permet pas toujours d'assurer l'interopérabilité entre plateformes différentes et régions différentes par une gestion adéquate de l'encodage des noms de fichiers. Seuls les logiciels serveur et client respectant le standard RFC 2640 en donnent la garantie, grâce à l'utilisation de l'encodage UTF-8 et accessoirement d'une nouvelle commande LANG permettant de choisir la langue des messages retournés par le serveur lors de la session FTP.L'encodage UTF-8 permet d'encoder les noms des fichiers provenant de n'importe quel pays, bien qu'un encodage plus spécifique puisse toujours être utilisé localement par le serveur, la conversion vers l'UTF-8 restant à sa discrétion.
Utilisation
Pour accéder à un serveur FTP, on utilise un client FTP, en ligne de commande ou avec une interface graphique.
Les utilisateurs de Linux ou d'un autre UNIX peuvent consulter une documentation (la plupart du temps installée par défaut) en tapant "man ftp".
La plupart des navigateurs récents autorisent les connexions FTP en utilisant une URL de type:
ftp://nom_d'utilisateur:mot_de_passe@nom_ou_adresse_du_serveur:port_ftp
En informatique anglophone on utilise login ou username pour utilisateur et passwd ou password pour mot de passe.
Par sécurité, il est conseillé de ne pas préciser le mot de passe, le serveur le demandera. Cela évite de le laisser visible dans l'historique du navigateur, mais ne change rien au fait qu'il soit transmis en clair à travers le réseau.
La partie port_ftp est optionnelle. S'il est omis le port par défaut sera utilisé.
Implémentations
Logiciels clients de FTP
Logiciels libres
-ftp (en ligne de commande sous Unix/Linux)
-Cyberduck (pour Mac OS X et Windows)
-FileZilla (pour Linux, Mac OS X et Windows)
-FireFTP (extension pour Firefox)
-gFTP (pour GNOME)
-NcFTP (Windows et systèmes de type UNIX)
-Yafc
Logiciels propriétaires
-FTP Rush (Windows 2000, Windows XP (32/64 bits), Windows 2003 (32/64 bits), Windows Vista (32/64bits), Windows 7 (32/64bits).
FTP Rush prend en charge les protocoles FTP, FXP, SFTP et TFTP. C'est un partagiciel.
-WebDrive(Windows 2000, Windows XP (32/64 bits), Windows 2003 (32/64 bits), Windows Vista (32/64 bits), Windows 7 (32/64 bits)
-CuteFTP (pour Mac OS X et Windows)
-Fetch (pour Mac OS X)
-Secure FTP Client (pour Java SE)
-Steed (pour Windows)
-Transmit (pour Mac OS X)
-Yummy FTP (pour Mac OS X)
Logiciels serveurs de FTP
Logiciels libres
-FileZilla Server
-vsftpd
-proftpd
-pure-ftpd
Logiciels propriétaires
-Titan FTP Server
Le protocole
Le protocole utilise deux types de connexions TCP:
-Une connexion de contrôle initialisée par le client, vers le serveur (port 21 en général), pour transmettre les commandes de fichiers (transfert, suppression de fichiers, renommage, liste des fichiers....)
-Une connexion de données initialisée par le client ou le serveur pour transférer les données requises (contenu des fichiers, liste de fichiers...).
-Une connexion de données initialisée par le client ou le serveur pour transférer les données requises (contenu des fichiers, liste des fichiers).
Etablissement des connexions
FTP peut s'utiliser de deux façons différentes
Mode actif:
En mode actif, c'est le client FTP qui détermine le port de connexion à utiliser pour permettre le transfert des données. Ainsi, pour que l'échange des données puisse se faire, le serveur FTP initialisera la connexion de son port de données (port 20) vers le port spécifié par le client. Le client devra alors configurer son pare-feu pour autoriser les nouvelles connexions entrantes afin que l'échange des données se fasse. De plus, il peut s'avérer problématique pour les utilisateurs essayant d'accéder à des serveurs FTP lorsque ces utilisateurs sont derrière une passerelle NAT. Etant donnée la façon dont fonctionne le NAT, le serveur FTP lance la connexion de données en se connectant à l'adresse externe de la passerelle NAT sur le port choisi. Certaines passerelles NAT n'ayant pas de correspondance pour le paquet reçu dans la table d'état, le paquet sera ignoré et ne sera pas délivré au client.
Mode passif:
En mode passif, le serveur FTP détermine lui-même le port de connexion à utiliser pour permettre le transfert des données (data connexion) et le communique au client. En cas de présence d'un pare-feu devant le serveur, celui-ci devra être configuré pour autoriser la connexion de données. L'avantage de ce mode est que le serveur FTP n'initialise aucune connexion. Ce mode fonctionne sans problèmes avec des clients derrière une passerelle NAT. Dans les nouvelles implémentations, le client initialise et communique directement par le port 21 du serveur, cela permet de simplifier les configurations des pare-feu serveur.
La connexion de contrôle
Cette connexion fonctionne en mode texte et est donc aisée à simuler avec Telnet.
Le client envoie une commande sous la forme d'une ligne de texte terminée par un retour à la ligne (CR suivi de LF, soit
\r\n
,0A0D en hexadécimal, ou le caractère 13 et le caractère 10 [En QuickBasic: CHR$(13)+CHR$(10)]).Par exemple, la commande suivante demande le téléchargement du fichier "fichier.txt":
RETR fichier.txt
N.B: Les commandes telles que GET ou PUT ne sont pas reconnues dans le protocole FTP, mais souvent utilisées par les logiciels de client FTP.
A la suite de l'envoi de la commande, le client reçoit une ou plusieurs réponses du serveur.Chaque réponse est précédée d'un code décimal permettant au client FTP de traiter la réponse qui peut comporter une ou plusieurs lignes de texte.Pour exemple précédent, si le serveur trouve le fichier demandé, il envoie au client:
150 File status okay; about to open data connection.
Selon ce que le client et le serveur ont convenu, l'un des deux écoute sur le port TCP convenu, et l'autre s'y connecte pour établir la connexion de données. Puis le serveur envoie au client le contenu du fichier demandé, ferme la connexion de données, et envoie la réponse suivante sur la
connexion de contrôle:
226 Closing data connection.
La connexion de contrôle réutilise le protocole de contrôle du terminal NVT introduite au départ pour Telnet, sous une forme simplifiée. Cela signifie en particulier que le code de code décimal 255 sert à introduire des séquences de contrôle de l'affichage.