HTTP bir kaynaktan dağıtılan ve ortak kullanıma açık olan hiperortam bilgi sistemleri için uygulama seviyesinde bir iletişim protokolüdür. HTTP, World Wide Web için veri iletişiminin temelidir; burada köprü metni belgeleri, örneğin bir fare tıklamasıyla veya bir web tarayıcısında ekrana dokunarak kullanıcının kolayca erişebileceği diğer kaynaklara köprüler içerir.
RSS, genellikle haber sağlayıcıları, bloglar ve podcastlar tarafından kullanılan, yeni eklenen içeriğin kolaylıkla takip edilmesini sağlayan bir web sayfası bildirimcisidir. Kullandığı dosya biçimleri .rss ve .xml'dir.
DNS, internet uzayını bölümlemeye, bölümleri adlandırmaya ve bölümler arası iletişimi organize etmeye yarayan, bilgisayar, servis, internet veya özel bir ağa bağlı herhangi bir kaynak için hiyerarşik dağıtılmış bir adlandırma sistemidir.
Web arama motoru veya internet arama motoru, web'de sistematik bir şekilde internet kullanıcılarının istedikleri bilgilere anında erişebilmek için sıkça kullandıkları bir yazılım türüdür. Birincil işlevi internette veya internetin bir kısmında bulunmuş olan verileri bir araya getirmek ve raporlamaktır. Arama sonuçları genellikle satırlara ayrılmış sonuç sayfaları şeklinde sunulur. Bulunan bilgiler arasında web sayfası bağlantıları, görseller, videolar, infografikler, yazılar, akademik makaleler ve diğer dosya türleri yer alabilir. Arama motoru, çıktı olarak elde edilmiş kayıtlar ve bilgilerin hepsini birbiriyle karşılaştırarak sorgulayan, bir sorgunun kabul edilebilmesi için gerekli faaliyetleri gerçekleştiren, elde edilen verilerin performanslarının en yüksek olmasını amaçlayan bir sorgulama ve bulma mekanizmasıdır. Bazı arama motorları, veri tabanlarında ve kamuya açık dizinlerde bulunan bilgileri de indeksler. Bu noktada toplanan veriler, web sitesi URL’sini, web sitesinin içeriğini açıklayan bazı anahtar kelimeleri veya anahtar kelime gruplarını, web sayfasını oluşturan kod yapısını ve web sitesinde verilen bağlantıları içerir. Arama motorları, insanlar tarafından derlenen web dizinlerinin aksine, "örümcek" denilen botlar tarafından toplanan bilgileri belirli bir algoritma yardımıyla gerçek zamanlı olarak yansıtabilirler. Ve de günümüzde World Wide Web ile çok iyi bir hale gelen arama motorları, giderek profesyonelleşmeye devam etmektedir.
Cascading Style Sheets, HTML'e ek olarak metin ve format biçimlendirme alanında fazladan olanaklar sunan bir işaretleme dilidir.
PageRank, Google tarafından geliştirilen ve web sayfalarının önemini belirlemek için kullanılan bir algoritmadır. İnternet üzerindeki bağlantıların analiz edilmesiyle hesaplanan Pagerank değeri Google Arama sonuçlarında sayfaların sıralanması için kullanılan faktörlerden biridir.
XHTML Arkadaşlar Ağı Global Multimedia Protocols Group tarafından geliştirilen, ağ sitesi sahiplerinin internet sitelerindeki bağlantılar yoluyla arkadaşlıklarını ifade etme biçimidir. XFN internet sitesi sahipleri, arkadaşlarına ait bağlantıları eklerken <a href> etiketine 'rel' niteliğini belirli biçimlerde eklemeleri gerekir.
Hiper Metin İşaretleme Dili web sayfalarını oluşturmak için kullanılan standart metin işaretleme dilidir. Dilin son sürümü HTML5'tir.
Site haritası protokolü sayesinde bir web tasarımcısı arama motorlarını, bir web sitesindeki taranacak URLler hakkında bilgilendirebilir. Bir site haritası bir sitedeki URLleri listeleyen bir XML dosyasıdır. Bu dosya sayesinde web tasarımcıları, taranacak sayfalarının üzerinde daha fazla kontrole sahip olurlar. Arama motorlarına hangi sayfanın ne sıklıkla değiştiği, en son ne zaman güncellendiği ve sitedeki hangi sayfa diğerlerinden daha önemli, öncelikli gibi bilgileri bu dosya ile gönderebilirler. Bu yolla arama motorları web sitelerini tararken daha verimli olabilmektedirler. Site haritaları yapı itibarıyla robots.txt URL hariç tutma protokolünün tamamlayıcısı olan bir URL dahil etme protokolüdür.
Backlink, bir internet sitesinin başka bir siteye vermiş olduğu, herhangi bir sayfasında banner veya metin bağlantısı (link) bulunması durumunda arama motorlarında değerinin yükselmesini sağlayan bir sistem.
Googlebot, Google tarafından kullanılan bir arama botudur. Bu bot web'deki dokümanları toplar ve Google Arama Motoru için aranabilir bir içerik listesi (index) oluşturur. Eğer site yöneticiyseniz ve sitenizin Google aramalarında ya da herhangi bir arama motoru botunun indeksleme işleminde çıkmasını istemiyorsanız sitenizin dizininde bir robots.txt adlı dosya oluşturarak, ya da sadece Googlebot için aşağıdaki meta etiketini kullanarak botların indekslemesini engelleyebilirsiniz.
Matematikte, Markov Zinciri, Markov özelliğine sahip bir stokastik süreçtir. Markov özelliğine sahip olmak, mevcut durum verildiğinde, gelecek durumların geçmiş durumlardan bağımsız olması anlamına gelir. Bir başka deyişle, mevcut durumun açıklaması, sürecin gelecekteki evrimini etkileyebilecek tüm bilgiyi kapsar. Gelecek durumlara belirli bir şekilde değil, olasılıksal bir süreçle ulaşılacaktır.
TrustRank, Stanford Üniversitesi ve Yahoo tarafından tanımlanan ve spama karşı mücadelede kullanılan bir link analiz tekniğidir. Spam olan web sayfalarının yarı otomatik bir şekilde belirlenmesidir.
Robot engelleme standardı, web böceği veya web örümceği gibi yazılımların web sunucularının kamuya açık bölümlerinin tamamına veya bir kısmına erişimini engellemeye yarayan bir standarttır. Genelde web sitelerini sınıflandırmak ve arşivlemek amacı ile arama motorları ya da düzeltilmiş kaynak kodları için site yöneticileri robotları kullanırlar. Robotlar bu işlem sonucunda web siteleri için site haritaları oluştururlar.
Inline Linking veya hotlink, bir web sitesinin başka web sitelerinde kayıtlı bulunan resim vb. içeriği kendi sayfaları içinde görüntülemesidir. Bunu HTML içindeki IMG etiketlerini kullanarak yapar. Örneğin, "example.com" alanındaki "picture.jpg" isimli resim dosyasını görüntülemek için IMG etiketinin SRC özelliği http://www.example.com/picture.jpg%5Bölü/kırık+bağlantı%5D şeklinde düzenlenir.
vCard elektronik kartvizit için bir dosya biçimi standarttır. vCard sıklıkla e-posta iletilerine bağlı, ancak World Wide Web veya anlık mesajlaşma gibi diğer yollarla değiştirilebilir. Onlar isim ve adres bilgilerini, telefon numaraları, e-posta adresleri, URL'ler, logolar, fotoğraflar ve ses klipleri içerebilir.
Cross-Origin Resource Sharing (CORS), bir web sayfası üzerindeki bazı kaynakların, kaynağın sunulduğu alan adının dışındaki bir alan adından istenebilmesine izin veren bir mekanizmadır. Bir web sayfası, özgürce kökler arası resimleri, stil sayfalarını, betikleri ve videoları ekleyebilmektedir. Ancak, bazı “alanlar arası” istekler, özellikle Ajax istekleri, Aynı Kök Politikası nedeniyle varsayılan olarak yasaklanmıştır.
Favicon, kısayol simgesi, website ikonu, sekme ikonu, URL ikonu veya yer imi ikonu olarak da bilinir, bir veya daha fazla küçük simge içeren bir dosyadır, belirli bir web sitesi veya web sayfası ile ilişkili. Bir web grafik tasarımcısı böyle bir simge yaratabilir ve onu bir web sitesine çeşitli yollarla yükleyebilir ve ardından grafiksel web tarayıcısı bundan yararlanabilir. Favicon desteği sağlayan tarayıcılar tipik olarak bir tarayıcının faviconunu adres çubuğu ve yer imleri listesinde sayfanın adının yanında gösterir. Sekmeli tarayıcı özelliğini destekleyen tarayıcılar tipik olarak sekmedeki sayfanın başlığının yanında bir sayfanın favicon'unu gösterir ve siteye özgü tarayıcı favicon'u masaüstü simgesi olarak kullanır.
Mikro veri, meta verileri web sayfalarındaki mevcut içeriğin içine yerleştirmek için kullanılan bir WHATWG HTML spesifikasyonudur. Arama motorları, web tarayıcıları ve tarayıcılar bir web sayfasından Mikro Verileri ayıklayıp işleyebilir ve kullanıcılar için daha zengin bir göz atma deneyimi sağlamak için kullanabilir. Arama motorları, bu yapılandırılmış verilere doğrudan erişimden büyük ölçüde yararlanır çünkü web sayfalarındaki bilgileri anlamalarına ve kullanıcılara daha alakalı sonuçlar sağlamalarına olanak tanır. Mikro veriler, bir öğeyi açıklamak için destekleyici bir kelime dağarcığı ve özelliklerine değerler atamak için ad-değer çiftlerini kullanır. Mikro veri, benzer RDFa ve mikro biçimler kullanım yaklaşımlarına göre, HTML öğelerine makine tarafından okunabilir etiketlerle açıklama eklemenin daha basit bir yolunu sağlama girişimidir.
Bir site haritası, bir etki alanındaki bir web sitesinin sayfalarının bir listesidir.