Ein verteiltes Dateisystem (DFS), wie der Name schon sagt, ist ein Dateisystem, das auf mehreren Dateiservern oder mehreren Speicherorten verteilt ist. Es ermöglicht Programmen, wie bei den lokalen auf isolierte Dateien zuzugreifen oder diese zu speichern, sodass Programmierer von jedem Netzwerk oder Computer aus auf Dateien zugreifen können.
Der Hauptzweck des verteilten Dateisystems (DFS) besteht darin, Benutzern physisch verteilter Systeme zu ermöglichen, ihre Daten und Ressourcen mithilfe eines gemeinsamen Dateisystems freizugeben., Eine Sammlung von Workstations und Mainframes, die über ein lokales Netzwerk (LAN) verbunden sind, ist eine Konfiguration auf einem verteilten Dateisystem. Ein DFS wird als Teil des Betriebssystems ausgeführt. In DFS wird ein Namespace erstellt und dieser Prozess ist für die Clients transparent.
DFS besteht aus zwei Komponenten:
- Standorttransparenz: Standorttransparenz wird durch die Namespace-Komponente erreicht.
- Redundanz: Redundanz erfolgt über eine Dateireplikationskomponente.,
Im Falle eines Ausfalls und einer hohen Last verbessern diese Komponenten zusammen die Datenverfügbarkeit, indem die gemeinsame Nutzung von Daten an verschiedenen Speicherorten logisch unter einem Ordner gruppiert werden kann, der als „DFS-Stammverzeichnis“bezeichnet wird.
Es ist nicht notwendig, beide Komponenten von DFS zusammen zu verwenden, es ist möglich, die Namespace-Komponente ohne Verwendung der Dateireplikationskomponente zu verwenden, und es ist durchaus möglich, die Dateireplikationskomponente ohne Verwendung der Namespace-Komponente zwischen Servern zu verwenden.,
Eigenschaften von DFS
- Transparenz:
- Strukturtransparenz: Der Client muss nicht über die Anzahl oder den Speicherort von Dateiservern und Speichergeräten Bescheid wissen. Mehrere Dateiserver sollten für Leistung, Anpassungsfähigkeit und Zuverlässigkeit bereitgestellt werden.
- Zugriffstransparenz: Auf lokale und entfernte Dateien sollte auf dieselbe Weise zugegriffen werden können. Das Dateisystem sollte sich automatisch auf der aufgerufenen Datei befinden und an die Clientseite senden.,
- Benennungstransparenz: Der Name der Datei sollte keinen Hinweis auf den Speicherort der Datei enthalten. Sobald ein Name für die Datei angegeben ist, sollte er während der Übertragung von einem Knoten auf einen anderen nicht geändert werden.
- Replikationstransparenz: Wenn eine Datei auf mehrere Knoten kopiert wird, sollten sowohl die Kopien der Datei als auch deren Speicherorte von einem Knoten zum anderen ausgeblendet werden.
- Benutzermobilität: Das Home-Verzeichnis des Benutzers wird automatisch auf den Knoten übertragen, auf dem sich der Benutzer anmeldet.,
- Leistung: Die Leistung basiert auf der durchschnittlichen Zeit, die benötigt wird, um die Clientanforderungen zu erfüllen. Diese Zeit deckt die CPU-Zeit + die Zeit ab, die für den Zugriff auf den sekundären Speicher + die Netzwerkzugriffszeit benötigt wird. Es ist ratsam, dass die Leistung des verteilten Dateisystems der eines zentralisierten Dateisystems ähnlich ist.
- Einfachheit und Benutzerfreundlichkeit: Die Benutzeroberfläche eines Dateisystems sollte einfach sein und die Anzahl der Befehle in der Datei sollte klein sein.,
- Hochverfügbarkeit: Ein verteiltes Dateisystem sollte im Falle von Teilfehlern wie einem Verbindungsfehler, einem Knotenfehler oder einem Speicherlaufwerksabsturz in der Lage sein, fortzufahren.
Ein hoch authentisches und anpassungsfähiges verteiltes Dateisystem sollte verschiedene und unabhängige Dateiserver zur Steuerung verschiedener und unabhängiger Speichergeräte haben.
History
Die Serverkomponente des verteilten Dateisystems wurde zunächst als Add-On-Funktion eingeführt. Es wurde zu Windows NT 4.0 Server hinzugefügt und wurde als „DFS 4.1″bekannt., Später wurde es als Standardkomponente für alle Editionen von Windows 2000 Server enthalten. Clientseitige Unterstützung wurde in Windows NT 4.0 und auch in einer späteren Version von Windows enthalten.
Linux-Kernel 2.6.14 und Versionen danach werden mit einem SMB-Client-VFS geliefert, der als „cifs“ bekannt ist und DFS unterstützt. Mac OS X 10.7 (lion) und höher unterstützt Mac-OS-X-DFS.
Anwendungen
- NFS: NFS steht für Network File System. Es handelt sich um eine Client-Server-Architektur, mit der ein Computerbenutzer Dateien remote anzeigen, speichern und aktualisieren kann., Das Protokoll von NFS ist einer der mehreren verteilten Dateisystemstandards für Network Attached Storage (NAS).
- CIFS: CIFS steht für Common Internet File System. CIFS ist ein Akzent von SMB. Das heißt, CIFS ist eine Anwendung des SIMB-Protokolls, die von Microsoft entwickelt wurde.
- SMB: SMB steht für Server Message Block. Es ist ein Protokoll zum Teilen einer Datei und wurde von IMB erfunden. Das SMB-Protokoll wurde erstellt, damit Computer Lese-und Schreibvorgänge für Dateien über ein lokales Netzwerk (LAN) auf einem Remote-Host ausführen können., Die auf dem Remote-Host vorhandenen Verzeichnisse können über SMB aufgerufen werden und werden als „Shares“bezeichnet.
- Hadoop: Hadoop ist eine Gruppe von open-source-software-Dienstleistungen. Es gibt ein Software-Framework für die verteilte Speicherung und den Betrieb von Big Data mit dem MapReduce-Programmiermodell. Der Kern von Hadoop enthält einen Speicherteil, bekannt als Hadoop Distributed File System (HDFS), und einen Betriebsteil, der ein MapReduce-Programmiermodell ist.
- NetWare: NetWare ist ein internes Computernetzwerk-Betriebssystem, das von Novell, Inc.entwickelt wurde., Es verwendete hauptsächlich kombiniertes Multitasking, um verschiedene Dienste auf einem PC unter Verwendung des IPX-Netzwerkprotokolls auszuführen.
Arbeiten von DFS
Es gibt zwei Möglichkeiten, wie DFS implementiert werden kann:
- Eigenständiger DFS-Namespace: Dies ermöglicht nur die DFS-Roots, die auf dem lokalen Computer vorhanden sind und kein Active Directory verwenden. Ein eigenständiges DFS kann nur auf den Computern erworben werden, auf denen es erstellt wird. Es bietet keine Fehlerfreigabe und kann nicht mit anderen DFS verknüpft werden. Eigenständige DFS-Wurzeln stoßen aufgrund ihres begrenzten Vorteils selten auf.,
- Domain-based DFS namespace: It stores the configuration of DFS in Active Directory, creating the DFS namespace root accessible at \\<domainname>\<dfsroot> or \\<FQDN>\<dfsroot>
Advantages
- DFS allows multiple user to access or store the data.,
- Damit können die Daten remote geteilt werden.
- Es verbesserte die Verfügbarkeit von Datei, Zugriffszeit und Netzwerkeffizienz.
- Verbesserte die Fähigkeit, die Größe der Daten zu ändern und verbessert auch die Fähigkeit, die Daten auszutauschen.
- Verteiltes Dateisystem bietet Transparenz der Daten, auch wenn Server oder Festplatte ausfällt.
- In verteilten Dateisystemknoten und-verbindungen muss gesichert werden, daher können wir sagen, dass Sicherheit auf dem Spiel steht.,
- Es besteht die Möglichkeit, Nachrichten und Daten im Netzwerk während der Bewegung von einem Knoten zum anderen zu verlieren.
- Datenbankverbindung im Falle eines verteilten Dateisystems ist kompliziert.
- Auch der Umgang mit der Datenbank ist im verteilten Dateisystem im Vergleich zu einem Einzelbenutzersystem nicht einfach.
- Es besteht die Möglichkeit einer Überlastung, wenn alle Knoten versuchen, Daten gleichzeitig zu senden.
Achtung reader! Hör jetzt nicht auf zu lernen., Holen Sie sich alle wichtigen CS Theory Konzepte für SDE Interviews mit dem CS Theory Kurs zu einem studentenfreundlichen Preis und werden Industrie bereit.