Data, Informasi dan Basis Data
Data merupakan fakta mengenai suatu objek seperti manusia, benda, peristiwa, konsep, keadaan dan sebagainya  yang  dapat  dicatat  dan  mempunyai  arti  secara  implisit.Data dapat  dinyatakan  dalam bentuk  angka,  karakter  atau  simbol,  sehingga  bila  data  dikumpulkan  dan  saling  berhubungan  maka dikenal dengan istilah basis data (database).Sedangkan menurut George Tsu-der Chou basis  data  merupakan  kumpulan  informasi  bermanfaat  yang  diorganisasikan  ke  dalam  aturan  yang khusus.  Informasi  ini  adalah  data  yang  telah  diorganisasikan  ke  dalam  bentuk  yang  sesuai  dengan kebutuhan  seseorang  Menurut  Encyclopedia  of  Computer  Science  and  Engineer,  para ilmuwan  di  bidang  informasi  menerima  definisi  standar  informasi  yaitu  data  yang  digunakan  dalam pengambilan keputusan.
Definisi lain dari basis data menurut Fabbri dan Schwab adalah sistem berkas terpadu yang dirancang terutama untuk meminimalkan duplikasi data
Menurut Ramez Elmasri mendefinisikan basis data lebih dibatasi pada arti implisit yang khusus, yaitu:
a.    Basis data merupakan penyajian suatu aspek dari dunia nyata (real world).
b. Basis  data  merupakan kumpulan  data  dari  berbagai  sumber  yang  secara  logika  mempunyai  arti implisit.  Sehingga  data  yang  terkumpul  secara  acak  dan  tanpa  mempunyai  arti,  tidak  dapat disebut basis data.
c. Basis data perlu dirancang, dibangun dan data dikumpulkan untuk suatu tujuan. Basis data dapat digunakan oleh beberapa user dan beberapa aplikasi yang sesuai dengan kepentingan user.
 
Hirarki Data
Data diorganisasikan kedalam bentuk elemen data (field), rekaman (record), dan berkas (file). Definisi dari ketiganya adalah sebagai berikut:
Berkas (file)
Rekaman (record) Rekaman (record) Rekaman (record) …
Elemen Data (field) Elemen Data (field) Elemen Data (field)
Gambar 1.1 Hirarki data
Sistem Basis Data
Gabungan antara basis data dan perangkat lunak  SMBD (Sistem Manajemen Basis Data)   termasuk  di  dalamnya  program  aplikasi  yang  dibuat  dan  bekerja  dalam  satu  sistem  disebut dengan Sistem Basis Data.
User/Programmer
Gambar 1.2 Konsep Sistem Basis Data (kompilasi Ramez Elmasri. dkk 1994)
Data Base Management System (DBMS)/Sistem Manajemen Basis Data (SMB)
DBMS  dapat  diartikan  sebagai  program  komputer  yang  digunakan  untuk  memasukkan,  mengubah, menghapus, memodifikasi dan memperoleh data/informasi dengan praktis dan efisien.
Kelebihan dari DBMS antara lain adalah:
• Kepraktisan.  DBMS  menyediakan  media  penyimpan  permanen  yang  berukuran  kecil  namun banyak menyimpan data jika dibandingkan dengan menggunakan kertas.
• Kecepatan. Komputer dapat mencari dan menampilkan informasi yang dibutuhkan dengan cepat.
• Mengurangi  kejemuan.  Pekerjaan  yang  berulang-ulang  dapat  menimbulkan  kebosanan  bagi manusia, sedangkan mesin  tidak merasakannya.
• Update to date. Informasi yang tersedia selalu berubah dan akurat setiap.
Keuntungan-keuntungan dalam penggunaan DBMS antara lain adalah:
a.  Pemusatan kontrol data. Dengan satu DBMS di bawah kontrol satu orang atau kelkompok dapat menjamin terpeliharanya standar kualitas data dan keamanan batas penggunaannya serta dapat menetralkan konflik  yang terjadi dalam persyaratan data dan integritas data dapat terjaga.
b.    Pemakaian data bersama (Shared Data). Informasi yang ada dalam  basis data dapat digunakan lebih efektif dengan pemakaian beberapa user dengan kontrol data yang terjaga.
c. Data  yang  bebas  (independent).  Program  aplikasi  terpisah  dengan  data  yang  disimpan  dalam komputer.
d.    Kemudahan dalam pembuatan program aplikasi baru.
e.    Pemakaian secara langsung. DBMS menyediakan interface yang memudahkan pengguna dalam mengolah data.
Kelemahan-kelemahan DBMS antara lain:
a.  Biaya.  Kebutuhan  untuk  medapatkan  perangkat  lunak  dan  perangkat  keras  yang  tepat  cukup mahal,  termasuk  biaya  pemeliharaan  dan  sumber  daya  manusia  yang  mengelola  basis  data tersebut.
b.    Sangat   kompleks.   Sistem   basis   data   lebih   kompleks   dibandingkan   dengan   proses   berkas, sehingga dapat mudah terjadinya kesalahan dan semakin sulit dalam pemeliharaan data.
c. Resiko data yang terpusat. Data yang terpusat dalam satu lokasi dapat beresiko  kehilangan data selama proses aplikasi.
Arsitektur DBMS
Arsitektur ini dikenal dengan nama arsitektur tiga skema (three-schema architecture) dimana fungsi ini untuk  memisahkan  antara  basis  data  fisik  dengan  program  aplikasi  user.  Skema-skema  tersebut adalah sebagai berikut:
a.    Level internal merupakan skema internal yang memuat deskripsi struktur penyimpanan basis data dan menggunakan model data fisikal serta mendefinisikan secara detail penyimpanan data dalam
basis data, serta jalur pengaksesan data.
b.    Level  konsepsual  adalah  skema  yang  memuat  deskripsi  struktur  basis  data  secara  keseluruhan untuk semua pemakai. Skema ini hanya memuat deskripsi tentang entitas, atribut, hubungan dan batasan, tanpa memuat deskripsi data secara detail.
c. Level  eksternal  merupakan  skema  eksternal  (user  view)  yang  mendefinisikan  pandangan  data terhadap sekelompok  user (local view)  dengan menyembunyikan data lain  yang tidak  diperlukan oleh kelompok user tersebut.
Keuntungan dari arsitektur ini antara lain:
a. Perubahan  skema  konsepsual,  yaitu  adanya  perubahan  dalam  skema  konsepsual  contohnya penambahan  suatu  item  data  tidak  akan  berpengaruh  pada  program  aplikasi.  Tetapi  jika  skema eksternal  tidak  sesuai  lagi  dengan  skema  konsepsual  yang  baru  maka  program  aplikasi  harus disesuaikan juga.
b. Perubahan  skema  internal.  Pemisahan  antara  skema  eksternal  dan  skema  internal  berfungsi untuk  menjaga  bila  terjadi  perubahan  skema  internal,  misalnya  ada  penambahan  “pointer”  pada rekaman tidak memerlukan perubahan pada aplikasi.
c. Perubahan  skema  eksternal.  Adanya  penambahan  skema  eksternal  atau  pembuatan  skema eksternal  baru  tidak  akan  berpengaruh  pada  aplikasi  yang  ada  selama  aplikasi  tersebut  tidak mengakses data berdasarkan skema yang baru.
Model Data
Model data dapat dikelompokkan berdasarkan konsep pembuatan deskripsi struktur basis data, yaitu:
a.    Model data konsepsual (high level) menyajikan konsep tentang bagaiman user memandang atau
memperlakukan data. Dalam model ini dikenalkan tiga konsep penyajian data yaitu:
• Entity  (entitas)  merupakan  penyajian  obyek,  kejadian  atau  konsep  dunia  nyata  yang keberadaannya  secara  eksplisit  didefinisikan  dan  disimpan  dalam  basis  data,  contohnya Mahasiswa, Matakuliah, Dosen, Nilai dan lain sebagainya.
• Atribute   (atribut)   adalah   keterangan-keterangan   yang   menjelaskan   karakteristik   dari suatu entitas seperti NIM, Nama, Fakultas, Jurusan untuk entitas Mahasiswa.
• Relationship (hubungan) merupakan hubungan atau interaksi antara satu entitas dengan yang  lainnya,  misalnya  entitas  pelanggan  berhubungan  dengan  entitas  barang  yang
dibelinya.
b.    Model  data  fiskal  (low  level)  merupakan  konsep  bagaimana  deskripsi  detail  data  disimpan  ke
dalam komputer dengan menyajikan informasi tentang format rekaman, urutan rekaman, dan jalur pengaksesan data yang dapat membuat pemcarian rekaman data lebih efisien.
c. Model  data  implementasi  (representational)  merupakan  konsep  deskripsi  data  disimpan  dalam
komputer dengan menyembunyikan sebagian detail deskripsi data sehingga para user mendapat gambaran global bagaimana data disimpan dalam komputer. Model ini merupakan konsep model data yang digunakan oleh model hirarki, jaringan dan relasional. 
Skema dan Instan Basis Data
Skema  basis  data  merupakan  deskripsi  dari  basis  data  yang  spesifikasinya  ditentukan  dalam  tahap perancangan  namun  tidak  terlalu  diharapkan  diubah  setiap  saat.  Penggambaran  skema  umumnya hanya berisi sebagian dari deatil deskripsi basis data.
MAHASISWA
NIM NAMA FAKULTAS JURUSAN
MATA KULIAH
KD_MK MATA KULIAH SKS
DOSEN
KD_DOSEN NAMA ALAMAT TELEPON
KULIAH
ID_KUL NIM KD_MK KD_DOSEN SEMESTER TAHUN NILAI
Gambar 1.3 Skema Basis Data Akademi
Sekelompok data yang tersusun dalam satu baris rekaman (record/tuple) dan tersimpan dalam basis data disebut dengan instansi (instance) atau kejadian (occurences).
BASIS DATA TERDISTRIBUSI
Sebuah sistem database terdistribusi berisikan sekumpulan site, di mana tiap-tiap site dapat berpartisipasi dalam pengeksekusian transaksi-transaksi yang mengakses data pada satu site atau beberapa site. Tiap-tiap site dapat memproses transaksi lokal yaitu sebuah transaksi yang mengakses data pada satu site di mana transaksi telah d itentu kan.
Sebuah site juga dapat mengambil bagian dalam mengeksekusi transaksi global yaitu transaksi yang mengakses data pada site yang berbeda di mana transaksi telah ditentukan, atau transaksi yang mengakses data pada beberapa site yang berbeda
Site-site dalam database terdistribusi dihubungkan secara fisik dengan berbagai cara. Beberapa topologi digambarkan sebagai sebuah graph yang simpul-simpulnya bersesuaian dengan site. Sebuah edge dari simpul A ke simpul B bersesuaian dengan sebuah hubungan langsung antara dua site. Beberapa konfigurasi (bentuk) digambarkan sebagai berikut:
Keuntungan dan Kerugian Database Terdistribusi 
a. Keuntungan-keuntungan dari database terdistribusi
1. Pengawasan distribusi dan pengambilan data
Jika sejumlah site yang berbeda dihubungkan satu sama lain, lalu seorang pemakai yang berada pada satu site dapat mengakses data yang tersedia pada site lain. Sebagai contoh : sistem distribusi pada sebuah bank memungkinkan seorang pemakai pada salah satu cabang dapat mengakses data cabang lain.
2. Reabiability dan availability Sistem distribusi dapat terus menerus berfungsi dalam   menghadapi kegagalan dari site individu atau mata rantai komunikasi antar site.
Misal : jika site-site gagal dalam sebuah sistem distribusi, site-site lainnya dapat melanjutkan operasi jika data telah direplikasi pada beberapa site
3. Kecepatan pemrosesan query
Jika sebuah query melibatkan data pada beberapa site, memungkinkan membagi query ke dalam sub query yang dapat dieksekusi dalam bentuk paralel oleh beberapa site. Perhitungan secara paralel mempercepat pemrosesan dari seorang pemakai query
4. Otonomi lokal
Pendistribusian sistem mengizinkan sekelompok individu dalam sebuah perusahaan untuk melatih pengawasan lokal melalui data mereka sendiri. Dengan kemampuan ini dapat mengurangi ketergantungan pada pusat pemrosesan
5. Efisien dan fleksibel
Data dalam sistem distribusi dapat disimpan dekat dengan titik di mana data tersebut dipergunakan. Data dapat secara dinamik bergerak atau disalin, atau salinannya dapat dihapus.
b. Kerugian-kerugian dari database terdistribusi
1. Harga software yamg mahal
Hal ini disebabkan sangat sulit untuk membuat sistem database distribusi
2. Kemungkinan kesalahan lebih besar
Site-site yang termasuk dalam sistem distribusi beroperasi secara paralel sehingga menjadi lebih sulit untuk menjamin kebenaran dari algoritma. Adanya kesalahan mungkin tak dapat diketahui
3. Biaya pemrosesan tinggi
Perubahan pesan-pesan dan penambahan perhitungan dibutuhkan untuk mencapai koordinasi antar site.
Dalam memilih sebuah disain untuk sistem database, perancang harus mengimbangi keuntungan dan kerugian dari database terdistribusi.
Fragmentasi Data 
Fragmentasi : relasi dipartisikan ke dalam beberapa bagian, setiap bagian disimpan
Ada beberapa hal yang terlibat dalam penyimpanan relasi pada database terdistribusi di antaranya fragmentasi data. Fragmentasi data memisahkan relasi ke dalam beberapa fragment. Tiap-tiap fragment disimpan pada site yang berbeda.
Pemisahan relasi global ke dalam fragment-fragment dapat disusun dengan menggunakan tiga jenis yang berbeda dari fragmentasi yaitu : fragmentasi horizontal, fragmentasi vertikal, dan fragmentasi campuran
Dalam seluruh jenis fragmentasi, sebuah fragment dapat didefinisikan dengan sebuah
ekspresi dalam sebuah bahasa relasional (dalam hal ini digunakan aljabar relasional)
yang mengambil relasi global sebagai operan dan memproduksi fragment sebagai hasil
Beberapa peraturan yang harus diikuti ketika mendefinisikan fragment :  Kondisi lengkap.
Seluruh data dari relasi global harus dipetakan ke dalam fragment. Fragmentasi tidak akan terjadi jika sebuah data item yang dimiliki oleh relasi global, tidak dimiliki oleh beberapa fragment.
Kondisi penyusunan kembali.
Harus selalu mungkin untuk menyusun kembali tiap-tiap relasi global dari fragment-fragmentnya. Hanya fragment-fragment yang disimpan dalam database terdistribusi yang dapat membangun relasi global kembali melalui operasi penyusunan kembali jika diperlukan.
Kondisi disjoin.
Kondisi ini sangat berguna terutama untuk fragmentasi horizontal, sementara untuk fragmentasi vertikal kondisi ini kadang-kadang dilanggar.
Replikasi : 
Sistem memelihara beberapa salinan (copy) dari relasi. Setiap salinan disimpan pada beberapa lokasi yang berbeda
Replikasi & Fragmentasi 
Rancangan ini merupakan kombinasi dari replikasi dan fragmentasi. Relasi dipartisikan ke dalam beberapa bagian. Sistem memelihara salinan yang identik untuk setiap bagian.
Distributed Database
 Distribution and autonomy of business units
 divisi dan departemen dari suatu organisasi tersebar secara geografis 
 Data sharing
 proses sharing data harus dilakukan secara mudah dan tepat 
 Data communications costs and reliability
 proses pertukaran data dalam jumlah yang besar melalui jaringan membutuhkan biaya yang besar dan berpengaruh pada performance jaringan  
Homogenous Distributed Database