3.2
Referensi dan Identitas
Semantic Web
mengandalkan konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari
sistem pelabelan Web yang bergantung pada beberapa konvensi atau yang lain.
Masalah dengan label di Web adalah bahwa setiap Sistem pada dasarnya
desentralisasi dan tidak diawasi, sesuai dengan Prinsip-prinsip yang mengatur
Web, tapi kurangnya sentralisasi memungkinkan skema yang berbeda dan konvensi,
dan memang kecerobohan untuk berkembang yang selanjutnya membuka kemungkinan
kegagalan referensi unik(URI).
3.2.1 Referensi: Ketika dua benda yang sama?
Desentralisasi adalah
masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta
konten. Objek yang sama mungkin disebut sejalan, sempurna, benar, sebagai 'Jane
Doe', 'Janey Doe', 'Jane A. Doe ',' Doe, J.A. 'dan sebagainya. Selanjutnya,
salah satu atau semua istilah -istilah ini dapat digunakan untuk merujuk ke
objek lain yang berbeda. Dan, tentu saja, aslinya Jane Doe mungkin salah eja:
'Jnae Doe', dll ini kegagalan referensi unik relatif sepele bagi pengguna manusia
untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja
keluar. Dan jika kita berharap untuk mengekstrak informasi yang dapat digunakan
dari repositori sangat besar informasi, di mana solusi kerajinan tangan dan
memeriksa referensi oleh mata tidak layak, pengolahan mesin tidak bisa
dihindari. Referensi masalah sangat mungkin terjadi ketika sumber informasi
yang digabung, masalah di mana-mana tapi yang serius dalam konteks dari
Semantic Web. Dan desentralisasi menghalangi Web membuat asumsi nama yang unik,
dalam cara Di sisi lain, URI menyediakan Web dengan sumber untuk menghindari
setidaknya beberapa masalah grounding tradisional, ketika dapat memutuskan
bahwa kedua istilah ini menunjuk ke URI yang sama..
Sebuah metode heuristik
untuk menyelesaikan bentrokan tersebut, di dunia nyata, adalah untuk membuat
penilaian cerdas berdasarkan informasi jaminan, dan ini telah menirukan online
dengan perhitungan komunitas praktek nama, berdasarkan jaringan hubungan
sekitarnya masing-masing instansi yang disengketakan. Secara umum, manajemen
referensi, dan resolusi referensi masalah, akan selalu sulit mengingat bahwa
Web mencakup sejumlah besar informasi mengumpulkan untuk sejumlah alasan yang
berbeda dan untuk memecahkan berbagai tugas; makna dan interpretasi sering
berubah, dan ada mungkin pada kesempatan menjadi kesepakatan sedikit tentang
referen istilah. Sebuah isu penting untuk Web Science justru bagaimana memahami
referensi dan representasinya, dan untuk menentukan sistem manajemen dan
formalisme akan memungkinkan pemahaman yang lebih besar dan pelacakan dari apa
yang Web ini mengaku untuk mengatakan tentang yang objek.
3.2.2
Bila dua halaman yang sama?
Sebuah halaman
mengambil alternatif pada masalah referensi adalah bahwa penentuan ketika dua halaman
web adalah halaman yang sama. Hal ini tentu saja akan sepele dalam banyak
kasus, teks "utama" disalin
dari satu halaman ke halaman lain, tetapi dikelilingi oleh berbagai iklan,
logo, header dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk
menentukan kuantitatif tingkat hubungan antara dua halaman. Kesamaan penilaian
bisa sembarangan dan pragmatis, tergantung pada konteks (mis memutuskan plagiat
atau hak cipta kasus pelanggaran), tetapi teknik dari teori informasi yang ada
untuk menghasilkan set tujuan nomor untuk memberi makan ke dalam proses
penilaian - misalnya, mengedit Levenshtein jarak, dan varian algoritma,
diberikan dengan jumlah minimum operasi dari beberapa basis set yang dibutuhkan
untuk mengubah satu kata menjadi lain.
Dasar untuk membuat
penilaian kemiripan tidak perlu menambah konten pada halaman, tetapi juga bisa
menjadi struktur hyperlink dalam yang halaman tertanam. Informasi yang
mengharuskan pengguna tidak perlu berasal dari satu halaman, tapi malah bisa
dipetik dari cluster dokumen seputar topik dasar, dan linkage struktur ada bisa
sangat penting. Dan mungkin lebih jauh cara memahami kesamaan antara pola
penggunaan tertentu halaman - dua halaman sering diakses pada titik-titik yang
sama di Web a browser. kesamaan berbasis konten dapat didekati dengan kata-kata
yang cocok atau subsequences dari dua halaman. teknik yang relatif sederhana
dapat digunakan untuk menentukan kemiripan antara dua halaman (rasio antara
ukuran persimpangan subsequences dan ukuran dari serikat mereka), dan penahanan
satu dengan lainnya (rasio antara persimpangan dan ukuran set terkandung) [48].
Linkbased metrik berasal dari bibliometrics dan analisis kutipan, dan fokus
pada link keluar dan link dalam dua halaman memiliki kesamaan, relatif ke ruang
umum link di cluster topik. metrik berbasis penggunaan mengeksploitasi
informasi yang dikumpulkan dari server log dan sumber-sumber lain tentang
ketika halaman yang dikunjungi, pada asumsi bahwa kunjungan dari yang sama
pengguna dalam sesi yang sama di situs yang sama cenderung konseptual terkait,
dan semakin besar kesamaan antara waktu akses pengguna untuk halaman web,
semakin besar kemungkinan halaman tersebut menjadi entah bagaimana terkait
konseptual
engineering
3.3 Web: new direction
pengembangan Web adalah
campuran dari penetapan standar, tidak terstruktur, kegiatan desentralisasi dan
inovasi, dan rekayasa yang disengaja. Pada bagian ini kita akan fokus pada yang
terakhir, dan meninjau terkemuka masalah teknik dan imperatif terbuka.
Pertumbuhan Web adalah jelas sesuatu yang diinginkan. Penyimpanan jumlah yang
selalu lebih besar dari informasi, dalam konteks percepatan perhitungan, akan
penting bagi masa mendatang. Tanpa penyimpanan cerdas dan pengambilan lebih
cepat untuk Media memori seperti video, maka akhirnya Web akan tumbuh terlalu
besar untuk teknologi sendiri. Misalnya, PageRank membutuhkan merangkak dan
caching dari bagian signifikan dari Web tersebut; keberhasilan Google
tergantung pada kemampuan untuk menjaga cache penurut sementara juga ukuran yang
signifikan. permintaan yang lebih besar untuk layanan personalisasi dan pencari
juga akan memberikan tekanan pada sistem. Memperluas cakupan pencarian untuk
mencakup item seperti multimedia, jasa atau komponen ontologi, juga akan
memerlukan mengejar program penelitian akademik, interface efektif dan model
bisnis yang masuk akal sebelum layanan komersial mulai beroperasi. Yang ada dan
mengembangkan pendekatan untuk memanfaatkan Web telah menjadi diperpanjang
menjadi lingkungan Web baru yang diciptakan (seperti P2P jaringan, misalnya).
3.3.1 Layanan Web
Layanan adalah wilayah
kunci di mana model rekayasa kami dari Web butuhkan untuk terlibat dan jasa
extended. Web didistribusikan potongan kode ditulis untuk memecahkan
tugas-tugas tertentu, yang dapat berkomunikasi dengan layanan lain melalui
pesan. tugas skala besar dapat dianalisis dan secara rekursif dipecah menjadi
sub-tugas yang dengan sedikit keberuntungan akan memetakan ke spesifik tugas
yang dapat ditangani oleh layanan. Jika itu terjadi, dan jika layanan
ditempatkan dalam konteks Web, yang berarti bahwa pengguna bisa memanggil
layanan yang bersama-sama dan kooperatif memenuhi kebutuhan mereka. Software
abstrak jauh dari hardware dan memungkinkan kita untuk menentukan mesin
komputasi dalam hal fungsi logis, yang memfasilitasi spesifikasi masalah dan
solusi dalam cara yang relatif intuitif. Sebagai contoh, WS-Net adalah bahasa
deskripsi arsitektural berdasarkan teori berwarna Petri net (yaitu perluasan
dari teori Petri net sederhana dengan dihargai, token diidentifikasi - lihat
Bagian 4.2.5 untuk diskusi singkat Petri nets), yang menggambarkan komponen
layanan Web dalam hal layanan yang menyediakan komponen lain, layanan yang
diperlukan untuk fungsi, dan operasi internal. Hasil akhirnya adalah model yang
meliputi aspek baik global dan lokal dari sistem pelayanan, memfasilitasi
integrasi layanan Web untuk mencapai tujuan-tujuan baru, sementara juga
menyediakan formalisme untuk evaluasi integrasi Proses aljabar (lihat Bagian
4.2.5) juga telah diterapkan untuk jasa. Sekali lagi, seperti dengan pendekatan
Petri net, penggunaan formal aljabar memungkinkan baik desain dan evaluasi
untuk mengambil tempat (atau memang salah satu atau yang lain, tergantung pada
apa metode alternatif yang tersedia untuk menghasilkan atau survei kode).
Misalnya, menjelaskan pemetaan antara proses aljabar dan BPEL4WS ekspresif (a
standar notasi berbasis XML untuk menggambarkan proses bisnis executable), yang
memungkinkan kedua penciptaan layanan di BPEL4WS diikuti oleh evaluasi dan verifikasi
menggunakan proses aljabar, atau generasi
kode BPEL4WS otomatis
dari penggunaan aljabar untuk menentukan layanan yang diinginkan. Secara umum,
aljabar spesifikasi layanan pada tingkat abstrak dan penalaran tentang mereka
telah menjadi daerah utama penelitian pada layanan. BPEL4WS adalah versi
panjang dari Eksekusi Proses Bisnis Bahasa BPEL, yang menjadi cara yang semakin
penting untuk interleave layanan Web dengan proses bisnis. BPEL ada batasnya,
tapi memungkinkan penciptaan layanan komposit dari layanan yang ada. Itu Tahap
selanjutnya adalah menyesuaikan pendekatan ini untuk lingkungan P2P, dan
kendaraan sedang dalam pengembangan untuk itu adalah CDL, alias WS-CDL, (Web
Services Description Language koreografi ]), sebuah bahasa berbasis XML untuk mendefinisikan
umum dan komplementer perilaku yang dapat diamati dalam kolaborasi P2P.
Tujuannya adalah agar kolaborasi P2P interoperable dapat disusun dengan
menggunakan Koreografi tanpa memperhatikan spesifik seperti platform yang
mendasari yang digunakan;
3.3.2
Pendekatan Terdistribusi: Komputasi Pervasif,
P2P dan grid Ada banyak
lingkungan hardware yang Web akan diharapkan untuk menembus, namun di mana
asumsi rekayasa yang berlaku untuk skala besar, lebih-atau-kurang tetap mesin
komputasi didedikasikan tidak selalu berlaku. Contoh yang jelas termasuk
komputasi mobile, di mana-mana (Atau meresap) komputasi mana interoperabilitas
menjadi masalah, sistem P2P dan komputasi grid. komputasi mobile membuat segala
macam tuntutan rekayasa; daya komputasi yang tersedia tidak luas dan pengguna
harus diasumsikan terus-menerus bergerak dengan variabel bandwidth dan akses.
Selanjutnya, menyajikan informasi kepada pengguna membutuhkan paradigma yang
berbeda dari PC, misalnya untuk memungkinkan pengguna untuk menerima informasi
yang cukup pada layar kecil untuk membuat penjelajahan menarik .akses mobile ke
Web dapat menjadi modus dominan di banyak negara, terutama yang berkembang,
terima kasih untuk harga yang relatif rendah dan keandalan koneksi nirkabel dan
baterai kekuatan. Penelitian di bidang ini penting untuk merata distribusi
sumber daya Web.
jaringan P2P, ditandai
dengan otonomi dari server pusat, konektivitas intermiten dan penggunaan
oportunistik dari sumber,adalah lingkungan menarik lain untuk generasi Web
berikutnya. Di jaringan seperti (termasuk jaringan file-sharing seperti
Napster, komunikasi jaringan seperti Skype, dan jaringan komputasi seperti
sebagai SETI rumah @), komputer menjadi komponen dalam terdistribusi sistem,
dan mungkin melakukan segala macam hal: back up orang lain ' file, menyimpan
fragmen dari file terenkripsi, melakukan pengolahan untuk berskala usaha di
latar belakang, dan sebagainya. Ada jelas banyak aplikasi potensial untuk kedua
jaringan P2P terstruktur dan tidak terstruktur dalam konteks Web. Pertanyaan
bagi para ilmuwan Web adalah apa fungsi penting untuk pengalaman Web dapat
dipertahankan di longgar sistem otonom ditambah. Mengingat karakteristik yang
tidak biasa P2P, termasuk jumlah berpotensi besar dan heterogenitas node P2P,
metode teknik tradisional seperti eksperimen secara online (yang akan
membutuhkan unfeasibly sejumlah besar pengguna untuk mendaftar untuk arsitektur
dan memungkinkan transaksi mereka yang akan dimonitor) atau simulasi skala
besar (Skala hanya terlalu besar) akan tidak pantas. Skala lisensi oleh Web,
yang kita akan terus melihat dalam jaringan P2P, membuat teori model jaringan
penting tapi kami harus mengharapkan eksperimentasi radikal, inovasi dan
kewirausahaan untuk memimpin jalan dalam bidang ini.
Godaan untuk mengeksploitasi
lingkungan radikal desentralisasi seperti sebagai jaringan P2P pada generasi
berikutnya dari Web adalah kuat; desentralisasi adalah aspek kunci dari
keberhasilan Web. Jadi, misalnya, salah satu bisa bayangkan jaringan P2P yang
digunakan untuk menemukan halaman cache untuk backup di terjadi kegagalan atau
kesalahan yang mengarah ke hilang halaman atau menjuntai link. Perlu ditetapkan
apakah kemampuan jaringan P2P untuk melakukan bahwa (yang sendiri saat ini
belum terbukti) akan merusak domain nama sistem atau mendukungnya.
Sedangkan sistem P2P
mengeksploitasi distribusi skala besar untuk mencapai banyak dari ujung kecil,
komputasi grid sering merupakan pendekatan didistribusikan ke masalah skala
besar menggunakan daya komputasi substansial untuk menganalisis besar jumlah
data. Masalahnya adalah mengkoordinasikan perilaku dari sejumlah besar
komputer, mengeksploitasi sumber daya yang tidak terpakai oportunis seperti
P2P; lagi seperti P2P, dan tidak seperti tradisional didistribusikankomputasi, komputasi
grid ini dimaksudkan untuk menjadi netral tentang administrasi atau batas
Platform. Oleh karena itu terbuka standar yang diperlukan, dan Grid membutuhkan
deskripsi abstrak sumber daya komputasi.
Dengan analogi ke Web
Semantic, Grid telah melahirkan SemanticGrid, di mana informasi dan sumber daya
komputasi yang dijelaskan dengan metadata (dan sebagai dengan SW RDF adalah
bahasa pilihan), memungkinkan eksploitasi spesifikasi mesin yang dapat dibaca
untuk koordinasi otomatis sumber daya untuk memecahkan masalah skala besar
tertentu Penerapan Grid dan Semantic Grid untuk besar masalah skala menunjukkan
janji besar - memang sebagai data dari CERN Large Hadron Collider mulai
beroperasi pada gigabyte / detik, Grid adalah sangat diperlukan.
Untuk mendapatkan
personalisasi yang efektif, ada harus diintegrasikan penggunaan informasi dari
sejumlah sumber, termasuk data tentang pengguna (clickstream data, pola
download, profil online), sumber daya yang disampaikan (konten situs, struktur
situs) dan pengetahuan domain, bersama-sama dengan teknik data mining yang
cukup untuk membuat pandangan menyeluruh dari sumber daya yang meliputi
sebanyak informasi yang dibutuhkan pengguna, dalam representasi yang akan masuk
akal bagi mereka, sementara tidak termasuk informasi mereka tidak akan mau, dan
yang bisa memperhitungkan dinamika sifat dari model pengguna. Semua itu, sambil
tetap mempertahankan relasi antara invariants dari pengalaman Web dan konteks
tertentu penggunaan individu yang memberdayakan dia untuk mengklaim sudut dari
dunia maya dan mulai menggunakannya sebagai perpanjangan dari ruang pribadi.
Mengingat bahwa, di Web, informasi yang relevan cenderung sangat
didistribusikan dan dinamis, personalisasi diharapkan menjadi salah satu
keuntungan besar dari Semantic Web, yang merupakan pra-nyata struktur yang
memungkinkan penalaran atas beberapa dan didistribusikan sumber data. Ada
banyak program rekayasa berlangsung menyelidiki heuristik untuk personalisasi
dari informasi yang tersedia, termasuk menggunakan pembelajaran mesin ,
ontologi , jaringan P2P ,dan memproduksi representasi untuk memfasilitasi
pengumpulan informasi penggun ,serta menyediakan lingkungan yang memfasilitasi
personalisasi dan link asosiatif berdasarkan user- agak dari penulis-preferensi
. untai penting dari personalisasi rekayasa adalah pengembangan alat untuk
memungkinkan neophytes relatif untuk menciptakan atau meningkatkan artefak
rekayasa pengetahuan yang kompleks, seperti ontologi atau pembungkus.
3.3.4
Multimedia
Web adalah lingkungan
multimedia, yang membuat untuk kompleks semantik - ini tentu saja tidak masalah
yang unik ke Web. Metareasoning dan epistemologi sering menganggap media
tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog.
Sebagai contoh ahli sering menggunakan diagram untuk mengekspresikan
pengetahuan mereka Sana memiliki upaya untuk menghasilkan 'bahasa-seperti'
taksonomi generatif representasi visual yang ,tetapi ini tidak tampaknya
memiliki aplikasi menarik. Beberapa peneliti telah mencoba untuk menemukan prinsip-prinsip
yang mungkin mendasari penalaran diagram . Secara umum, tidak diketahui
bagaimana mengambil semantik dari representasi non-tekstual andal; Fenomena ini
dikenal sebagai kesenjangan semantik.
Namun demikian,
generasi Web berikutnya tidak harus didasarkan pada asumsi yang salah bahwa
teks adalah dominan dan kata kunci berbasis penelusuran akan cukup untuk semua
tujuan yang wajar . Memang, masalah berkaitan dengan navigasi melalui
repositori multimedia seperti video arsip dan melalui Web tersebut tidak
berhubungan: baik membutuhkan informasi link untuk mendukung browsing, dan
keduanya perlu mesin untuk mendukung pengguna Link traversal. Namun, pendekatan
kata kunci mungkin goyah di multimedia konteks karena kekayaan yang lebih besar
dari banyak non-tekstual Media . Google Pendekatan pencarian gambar bergantung
pada sekitarnya teks untuk gambar, misalnya, yang memungkinkan pencarian yang
relatif cepat, dan lagi pada umumnya pengguna seringkali mampu membuat pilihan
akhir oleh memilah-milah rekomendasi disajikan (gambar berbasis keyword
pencarian cenderung menghasilkan banyak hits lebih sedikit, yang mungkin
berarti mereka hilang banyak kemungkinan yang masuk akal). Kehadiran manusia di
loop sulit untuk menghindari saat ini: intervensi manusia dalam proses
mengintegrasikan bahasa visi dengan modalitas lain yang biasanya diperlukan,
meskipun ada sejumlah teknik yang menarik untuk menggunakan struktur yang
dihasilkan dari teks yang terkait dengan koleksi gambar untuk pengambilan
bantuan dalam konteks dibatasi.Tetapi selalu mungkin untuk mengeluarkan lebih
banyak sumber daya menganalisa suatu image (katakanlah) untuk menghasilkan
pertandingan yang lebih baik untuk pencarian kata kunci, jika kecepatan tidak
merupakan faktor utama.
Sebagai hybrid menarik
telah disarankan bahwa kesenjangan semantik bisa diisi dengan ontologi dari
visual yang mencakup istilah tingkat rendah dan memberikan semacam pemetaan ke
konsep abstrak-tingkat yang lebih tinggi disajikan dalam query dan metadata
.Seperti infrastruktur memiliki telah dibuat, menggunakan (i) deskriptor visual
yang ontologi didasarkan pada RDF representasi dari MPEG-7 deskripsi visual,
(ii) struktur multimedia ontologi berdasarkan skema deskripsi multimedia MPEG-7
dan (iii) inti primitif pemodelan ontologi pada akar konsep hierarki yang
dimaksudkan untuk bertindak sebagai jembatan antara ontologi, semua dilengkapi
dengan domain ontologi . Selanjutnya penting Masalah terbuka adalah
interoperabilitas teknologi Semantic Web dengan metadata berbasis non-RDF
seperti EXIF metadata pada file JPEG atau tag gambar
informal yang dibuat di Flickr . pekerjaan lebih lanjut diperlukan pada
hubungan antara persyaratan pengambilan gambar manusia dan kemungkinan
otomatisasi, termasuk pemahaman yang lebih dalam dari kemampuan relatif
folksonomi dan ontologi .
3.3.5
Pengolahan Bahasa Alami
Akhirnya, ada isu-isu
substansial yang berkaitan dengan pengolahan bahasa alami (NLP), analisis
komputasi data tidak terstruktur dalam teks-teks untuk menghasilkan pemahaman
mesin (pada tingkat tertentu) dari teks yang. NLP berkaitan dengan Web dalam
sejumlah cara. Di tempat pertama, alami Bahasa adalah domain yang sangat
jarang, di sebagian besar kalimat yang diucapkan atau ditulis terjadi sekali
saja atau sangat jarang, dan skala raksasa Web menyediakan corpus menarik untuk
NLP penalaran. Sebuah angka perkiraan baru-baru ini untuk ukuran dari Web
adalah dua ribu miliar kata, yang 71% berasal dari Inggris, 6,8% Jepang dan
5,1% Jerman. banyak yang relatif bahasa umum seperti Slovenia atau Melayu bisa
membanggakan 100m kata online, ukuran yang sama seperti Nasional Inggris yang
banyak digunakan dan dihormati Corpus. Ada argumen tentang bagaimana wakil Web
adalah sebagai corpus, tetapi gagasan tentang apa corpus harus mewakili – harus
itu termasuk pidato, tulisan, bahasa latar belakang seperti bergumam atau
berbicara dalam tidur seseorang, atau kesalahan misalnya? - Sulit untuk
dijabarkan dengan setiap presisi .
Kedua, mengingat
masalah dari skala Web, teknik NLP akan menjadi penting dalam tugas-tugas
seperti summarisation yang dapat memberikan dukungan yang berguna untuk
bagian-bagian manusia tugas pencarian. Ketiga, NLP memiliki potensi besar untuk
pembangunan macam antarmuka intuitif yang heterogen dan belum tentu
computerliterateWeb komunitas pengguna membutuhkan. Memang mungkin membantu
menjembatani kesenjangan antara visi SW dari Web terdiri dari data yang
dimanipulasi secara logis, dan visi yang lebih tradisional dari Web sebagai
tempat yang berguna dokumen yang akan diambil. Misalnya, dapat teknik NLP
digunakan untuk menemukan dan mengungkapkan metadata?Teks yang mengandung tidak
terstruktur Data sekarang dapat dipetakan ke sumber daya yang ada seperti ontologi
untuk menyediakan markup dan penjelasan, setelah sesi pelatihan awal. Komputasi
ontologi seperti yang kita jumpai berbeda dalam tujuan dan struktur dari
thesaurus dan taksonomi dari dunia NLP, meskipun ada perdebatan tentang tingkat
dan sifat dari perbedaan . sumber NLP juga memiliki sesuatu kesamaan dengan
folksonomi dan sejenisnya, serta pentingnya perbedaan. Dari sudut pandang Ilmu
Web, pertanyaan terbuka yang penting ada sebagai hubungan antara NLP dan Web;
adalah statistik teknik yang digunakan dalam NLP bertentangan atau saling
melengkapi dengan logis teknik dan semantik berdasarkan interogasi data yang
digunakan oleh masyarakat SW? Atau alternatif ada divisi optimal analitis kerja
antara dua jenis pendekatan yang kita mungkin mengeksploitasi? Banyak
tergantung pada bagaimana kita menafsirkan pengembangan Web. Untuk Misalnya,
jika seseorang melihat tugas utama sebagai untuk membubuhi keterangan dan
memberikan konteks yang kaya untuk konten dan struktur “menjinakan web” maka
NLP akan memainkan peran kunci dalam hal itu, termasuk pemetaan melayang dalam
arti dari waktu ke waktu.Jika kita memahami Semantic Web sebagai berfokus pada
data dan model database relasional, maka logis Ketentuan dan URI gigih menjadi
pusat. NLP bekerja dengan baik statistik; SW, sebaliknya, membutuhkan logika
dan belum menggunakan substansial statistik. bahasa alami adalah demokratis,
seperti yang diungkapkan dalam slogan 'artinya adalah menggunakan' . Setara
dalam SW dari kata-kata bahasa alami adalah hal yang logis, yang URI yang
menonjol. Demikian kami memiliki disanalogy langsung antara NLP dan SW, yang
bahwa URI, tidak seperti kata-kata, memiliki pemilik, dan dapat diatur. Itu
adalah bukan untuk mengatakan bahwa peraturan tersebut akan menjamin kekebalan
dari makna melayang yang ahli bahasa mendeteksi, tetapi juga dapat memberikan
stabilitas yang cukup atas jangka pendek dan menengah.

0 comments:
Post a Comment