Un File System distribuito (DFS) come suggerisce il nome, è un file system che viene distribuito su più file server o più posizioni. Consente ai programmi di accedere o archiviare file isolati come fanno con quelli locali, consentendo ai programmatori di accedere ai file da qualsiasi rete o computer.
Lo scopo principale del File System distribuito (DFS) è quello di consentire agli utenti di sistemi fisicamente distribuiti di condividere i propri dati e risorse utilizzando un File System comune., Una raccolta di workstation e mainframe collegati da una rete locale (LAN) è una configurazione su file System distribuito. Un DFS viene eseguito come parte del sistema operativo. In DFS, viene creato uno spazio dei nomi e questo processo è trasparente per i client.
DFS ha due componenti:
- Trasparenza della posizione: la trasparenza della posizione raggiunge attraverso il componente dello spazio dei nomi.
- Ridondanza: la ridondanza viene eseguita tramite un componente di replica dei file.,
In caso di guasto e carico pesante, questi componenti insieme migliorano la disponibilità dei dati consentendo la condivisione dei dati in posizioni diverse da raggruppare logicamente in un’unica cartella, nota come “DFS root”.
Non è necessario utilizzare entrambi i due componenti di DFS insieme, è possibile utilizzare il componente dello spazio dei nomi senza utilizzare il componente di replica file ed è perfettamente possibile utilizzare il componente di replica file senza utilizzare il componente dello spazio dei nomi tra i server.,
Caratteristiche di DFS
- Trasparenza:
- Trasparenza della struttura: non è necessario che il client conosca il numero o le posizioni dei file server e dei dispositivi di archiviazione. Devono essere forniti più file server per prestazioni, adattabilità e affidabilità.
- Trasparenza di accesso: sia i file locali che quelli remoti devono essere accessibili nello stesso modo. Il file system deve essere posizionato automaticamente sul file a cui si accede e inviarlo al lato client.,
- Trasparenza dei nomi: non dovrebbe esserci alcun suggerimento nel nome del file nella posizione del file. Una volta dato un nome al file, non dovrebbe essere modificato durante il trasferimento da un nodo all’altro.
- Trasparenza di replica: se un file viene copiato su più nodi, sia le copie del file che le loro posizioni devono essere nascoste da un nodo all’altro.
- Mobilità utente: porterà automaticamente la directory home dell’utente al nodo in cui l’utente accede.,
- Prestazioni: Le prestazioni si basano sulla quantità media di tempo necessaria per convincere le richieste del cliente. Questa volta copre il tempo di CPU + tempo impiegato per accedere allo storage secondario + tempo di accesso alla rete. È consigliabile che le prestazioni del File system distribuito siano simili a quelle di un file system centralizzato.
- Semplicità e facilità d’uso: L’interfaccia utente di un file system dovrebbe essere semplice e il numero di comandi nel file dovrebbe essere piccolo.,
- Alta disponibilità: un file system distribuito dovrebbe essere in grado di continuare in caso di errori parziali come un errore di collegamento, un errore di nodo o un arresto anomalo dell’unità di archiviazione.
Un alto file system distribuito autentico e adattabile dovrebbe avere file server diversi e indipendenti per il controllo di dispositivi di archiviazione diversi e indipendenti.
Cronologia
Il componente server del File System distribuito è stato inizialmente introdotto come funzionalità aggiuntiva. E ‘stato aggiunto a Windows NT 4.0 Server ed era conosciuto come “DFS 4.1”., Poi in seguito è stato incluso come componente standard per tutte le edizioni di Windows 2000 Server. Il supporto lato client è stato incluso in Windows NT 4.0 e anche nella versione successiva di Windows.
I kernel Linux 2.6.14 e le versioni successive sono dotati di un client SMB VFS noto come “cifs” che supporta DFS. Mac OS X 10.7 (lion) e versioni successive supporta Mac OS X DFS.
Applicazioni
- NFS: NFS sta per Network File System. È un’architettura client-server che consente a un utente di computer di visualizzare, archiviare e aggiornare i file in remoto., Il protocollo di NFS è uno dei numerosi standard di file system distribuiti per Network-Attached Storage (NAS).
- CIFS: CIFS sta per Common Internet File System. CIFS è un accento di SMB. Cioè, CIFS è un’applicazione del protocollo SIMB, progettato da Microsoft.
- SMB: SMB sta per Server Message Block. Si tratta di un protocollo per la condivisione di un file ed è stato inventato da IMB. Il protocollo SMB è stato creato per consentire ai computer di eseguire operazioni di lettura e scrittura su file su un host remoto su una rete locale (LAN)., Le directory presenti nell’host remoto sono accessibili tramite SMB e sono chiamate “condivisioni”.
- Hadoop: Hadoop è un gruppo di servizi software open-source. Fornisce un framework software per lo storage distribuito e il funzionamento di big data utilizzando il modello di programmazione MapReduce. Il nucleo di Hadoop contiene una parte di archiviazione, nota come Hadoop Distributed File System (HDFS), e una parte operativa che è un modello di programmazione MapReduce.
- NetWare: NetWare è un sistema operativo di rete di computer abbandono sviluppato da Novell, Inc., Ha utilizzato principalmente il multitasking combinato per eseguire diversi servizi su un personal computer, utilizzando il protocollo di rete IPX.
Funzionamento di DFS
Ci sono due modi in cui DFS può essere implementato:
- Spazio dei nomi DFS autonomo: consente solo per quelle radici DFS che esistono sul computer locale e non utilizzano Active Directory. Un DFS autonomo può essere acquisito solo sui computer su cui è stato creato. Non fornisce alcuna liberazione di guasto e non può essere collegato a nessun altro DFS. Le radici DFS standalone sono raramente incontrate a causa del loro vantaggio limitato.,
- Domain-based DFS namespace: It stores the configuration of DFS in Active Directory, creating the DFS namespace root accessible at \\<domainname>\<dfsroot> or \\<FQDN>\<dfsroot>
Advantages
- DFS allows multiple user to access or store the data.,
- Esso consente ai dati di essere condividere in remoto.
- Ha migliorato la disponibilità di file, il tempo di accesso e l’efficienza della rete.
- Migliorata la capacità di modificare la dimensione dei dati e migliora anche la capacità di scambiare i dati.
- Il file system distribuito fornisce la trasparenza dei dati anche se il server o il disco non riesce.
Svantaggi
- Nel File System distribuito i nodi e le connessioni devono essere protetti, quindi possiamo dire che la sicurezza è in gioco.,
- C’è la possibilità di perdere messaggi e dati nella rete mentre si sposta da un nodo all’altro.
- La connessione al database in caso di file System distribuito è complicata.
- Anche la gestione del database non è facile nel File System distribuito rispetto a un singolo sistema utente.
- Ci sono possibilità che si verifichi un sovraccarico se tutti i nodi tentano di inviare dati contemporaneamente.
Lettore di attenzione! Non smettere di imparare ora., Entrare in possesso di tutti gli importanti concetti di Teoria CS per le interviste SDE con il corso di Teoria CS ad un prezzo studente-friendly e diventare industria pronta.