25.11.2025

Çağrı merkezleri için ElevenLabs çözümleri

Sesli AI ajanı uygulamayı mı düşünüyorsunuz? ElevenLabs incelemesi: mimari, platform özellikleri ve sesli bot oluşturma.

Çağrı merkezleri için ElevenLabs çözümleri

Platformun teknik mimarisi

Platform özellikleri

Pratik dağıtım

AI ajanı nerede kullanılabilir?

Analitik ve izleme

ElevenLabs’ta Workflow

Çok kanallı iletişim

Fiyatlandırma

AI teknolojileri deneysel bir trendden iş dünyasının ana akımına dönüştü. Şirketler rutin işleri otomatikleştirmek için yapay zekayı kitlesel olarak benimsiyor. Çağrı merkezleri AI’ya katı gereksinimler dayatıyor: gecikme olmadan anında yanıtlar, memnuniyetsiz müşterilerle çalışmak için duygusal zeka, karmaşık vakaların operatörlere sorunsuz aktarımı, tüm iletişim kanallarının desteklenmesi ve kurumsal düzeyde güvenilirlik.

Müşteri hizmetleri sistemini modernize etmeye karar veren bir yönetici için, hizmet seçimi gerçek bir baş ağrısına dönüşüyor. Piyasada teknoloji devlerinden kimsenin tanımadığı startup’lara kadar yüzlerce AI platformu var ve her birinin kendi fiyatları, özellikleri ve tuzakları mevcut.

Bizce dikkat edilmesi gereken hizmetlerden biri ElevenLabs. Bu, sesli iletişim için özelleşmiş bir platform. Birçok “evrensel çözüm” sunan hizmetten farklı olarak ElevenLabs farklı bir strateji seçti. “Her şey için” bir platform oluşturmaya çalışmak yerine, tek bir somut göreve odaklandılar – minimum geliştirme ve yapılandırma süresiyle kaliteli sesli AI ajanı oluşturma.

Platformun teknik mimarisi

ElevenLabs nedir?

ElevenLabs — Sesli AI alanında sesli ajanlar oluşturma sorununa beklenmedik bir açıdan yaklaşan bir araştırma ve uygulama kuruluşu. ElevenLabs Agents Platform — tamamen yapılandırılmış konuşma sesli ajanlarını dağıtmak için bir hizmet oluşturdular.

Yaklaşımın avantajı özellikle geleneksel sesli ajan oluşturma yöntemiyle karşılaştırıldığında belirgindir – genellikle karmaşık ve uzun bir projeye dönüşen bir süreç:

  • müşterilerinizin aksanlarını anladığını umarak bir konuşma tanıma sistemi seçmeniz gerekiyor;
  • halüsinasyon görmemesi için bir dil modeli seçmek;
  • 80’ler filmlerinden bir robot gibi ses çıkarmadığını kontrol ederek bir konuşma sentezi sistemi bulmak;
  • tüm bunların birlikte çalışmasını sağlamak için altı aylığına bir geliştirici ekibi kiralamak.

ElevenLabs ile her şey daha basit – hazır bir çözüm oluşturdular.

Sistemin temel bileşenleri

ElevenLabs platformu birbirleriyle senkronize çalışan dört ana bileşenden oluşur.

ASR (Automatic Speech Recognition) — konuşmanın bağlamını anlayan, teknik terimleri ayırt eden, açık ofis veya sokağın arka plan gürültüsüyle başa çıkan model. Aksanları tanır, müşteri duygusal ve hızlı konuştuğunda ve kelimeleri güvensizce seçtiğinde anlar. Model milyonlarca saatlik gerçek konuşma üzerinde eğitilmiştir ve sürekli olarak geliştirilmektedir.

LLM (Large Language Model) — insan konuşmasını anlayan ve üreten, büyük hacimli metinler üzerinde eğitilmiş bir sinir ağı. Basit bir deyişle, anlamlı diyaloglar kurmasına, soruları yanıtlamasına ve görevleri çözmesine olanak tanıyan AI asistanının “beyni”dir.

Ancak sizi kendi modellerini kullanmaya zorlayan birçok platformdan farklı olarak ElevenLabs seçim sunuyor: Google Gemini, OpenAI, Anthropic, Custom LLM. Desteklenen modellerin listesi dokümantasyonda.
GDPR (General Data Protection Regulation) uyarınca platform “EU data residency” modunu sunuyor — tüm veriler yalnızca AB sunucularında saklanıyor ve işleniyor. Mod etkinleştirildiğinde Gemini ve Claude’un bazı eski sürümleri kullanılamaz, ancak Custom LLM ve OpenAI kısıtlama olmadan çalışır.

TTS (Text-to-Speech) — bu markanın sesi. Ve burada ElevenLabs gerçekten etkileyici: 31 dilde 5000’den fazla ses. Bunlar robotik sesler değil, tonlamalar, duraklamalar, duygusal renklendirme ile canlı konuşma. Çoğu zaman müşteriler ilk dakikalarda AI’yı tanımıyor — sentez kalitesi konuşmayı insan konuşmasından neredeyse ayırt edilemez kılıyor.

Custom turn-taking (diyalogda sıra belirleme modeli) — konuşmayı doğal hale getirir. Turn-taking kullanıcının cümlesinin veya duraklamasının bittiği anı belirler ve AI ajanına ne zaman konuşmaya girebileceği veya yanıtı duraklatması gerektiği sinyalini vererek akıcı bir diyalog sürdürür. Bu, bir robotla konuşmayı garip duraklamalar veya kesintiler olmadan “canlı” hale getiren anahtar teknolojilerden biridir. X saniye sessizlik bekleyen basit sistemlerden farklı olarak, bu model bağlamı ve tonlamaları anlar.

Konuşma sentezi modelleri

ElevenLabs cephaneliğinde, her biri belirli kullanım senaryoları için optimize edilmiş dört ana konuşma sentezi modeli bulunur.

Eleven v3 kusursuz telaffuzla 70’ten fazla dili destekler, samimi empati’den profesyonel coşkuya kadar duygusal nüansları aktarabilir. Model çok sesli diyaloğu destekler, bu da birden fazla karakterle senaryolar oluşturmaya olanak tanır. Tek sınırlama tek seferde 10.000 karakter, bu da yaklaşık 5-6 sayfa metne karşılık gelir.

Nerede kullanılır? VIP desteği, premium hizmetler, ses kalitesinin marka algısını doğrudan etkilediği imaj projeleri için.

Multilingual v2 dünyanın 29 ana dilini istikrarlı kaliteyle destekler, özellikle uzun monologlar için iyidir — örneğin, sözleşme koşullarını veya ayrıntılı talimatları okumak gerektiğinde. Ayrıca 10.000 karakter limiti var ve duygusal ifade yerine istikrar için optimize edilmiş. Standart destek ve uluslararası operasyonlar için idealdir.

Flash v2.5 gecikme sadece 75 milisaniye. Bu model neredeyse anında yanıt sağlar. 32 dili destekler ve 40.000 karaktere kadar artırılmış limite sahiptir. Bonus olarak — diğer modellerden %50 daha ucuzdur. Toplu aramalar, “bakiye öğrenme” veya “sipariş durumu” gibi basit taleplerin işlenmesi için uygundur — hızın ve maliyetin duygusal nüanslardan daha önemli olduğu her yerde.

Turbo v2.5 sistem yanıt gecikmesi 250-300 ms, 32 dil desteği, 40.000 karakter limiti. Bu model ses kalitesi, yanıt hızı ve maliyet arasında optimal dengeyi sağlar. Çağrı merkezlerinin çoğu senaryosu için uygundur.

Ses modellerinin endüstri terminolojisi için tam yeniden eğitimi henüz mevcut olmasa da, platform bu görevi çözmek için etkili araçlar sunuyor.

  • Telaffuz sözlükleri AI’nın karmaşık terimleri, kısaltmaları veya marka adlarını nasıl telaffuz ettiğini yapılandırmanıza olanak tanır. Örneğin, ürün “XCloud” olarak adlandırılıyorsa ancak müşteriler “İks-Klaud” değil “Eks-Klaud” duymaya alışıksa, bu kuralı sözlüğe eklemeniz gerekir. Sistem hatırlayacak ve tüm konuşmalarda doğru telaffuzu kullanacaktır.
  • Takma ad etiketleri (alias tags) akıllı değiştirme olarak çalışır — sisteme teknik bir terim yerine anlaşılır benzerini söylemesini belirtirsiniz. Bu özellikle müşteriyle konuşmada farklı ses çıkaran dahili ürün veya hizmet kodları için kullanışlıdır.

Bu yaklaşım, tüm modeli pahalıya mal olan yeniden eğitime gerek kalmadan telaffuz sorunlarının çoğunu çözer.

Belirli bir sentez modeli seçmenin yanı sıra, ElevenLabs Multi-voice işlevini destekler — farklı departmanlar veya senaryolar için birden fazla ses kullanma imkanı. Örneğin, teknik destek sakin bir erkek sesiyle, satış departmanı enerjik bir kadın sesiyle ve VIP desteği hafif bir İngiliz aksanıyla konuşabilir. Bu işlev, müşteri aynı ajanla konuşsa bile gerçek bir ekip etkisi yaratır. Ayrıca Multi-voice, aramayı “kıdemli uzmana” aktarmayı taklit etmek veya rol senaryolarıyla operatörleri eğitmek için kullanılabilir.

Speech Recognition (konuşma tanıma)

Scribe-v1

Bu sadece bir transkriptör değil, 99 dille çalışan tam teşekküllü bir konuşma anlama sistemi. Detaylı liste burada bulunabilir.
Ukraynalı işletmemiz için önemli olan, sistemin yerel telaffuz özellikleriyle bile Ukrayna dilini anlamasıdır. Dahası, müşteri aynı konuşmada bazen Ukraynaca bazen başka bir dilde konuştuğunda başa çıkar — sistem otomatik olarak dil değişimini tanır ve söylenen her şeyi doğru şekilde kaydeder. Bu, operatörlerin farklı dillerde müşterilerle çalışması gereken Ukrayna çağrı merkezlerinin gerçek sorununu çözer.

Konuşma tanımanın temel işlevleri:

  • Kelime düzeyinde zaman damgaları — konuşmadaki her kelimenin zamanını kaydetme. Analiz için kullanışlıdır: müşterinin yöneticiyi istediği veya hizmeti iptal etmek istediği anı hızlıca bulabilirsiniz;
  • Konuşmacı belirleme işlevi (speaker diarization) konuşmadaki farklı kişilerin seslerini otomatik olarak ayırır;
  • Dinamik ses işaretleme – sistem konuşmacının duygusal durumunu belirler, duraklamaları, ünlemleri, sesteki güvensizliği işaretler.

Sistemin tüm bileşenleri tek bir sonuç için çalışır — insandan ayırt edilemeyen bir AI ajanı oluşturma. Doğal konuşma, bağlamı anlama, diyalogdaki doğru duraklamalar, ayrı parçalardan çözüm oluşturma gerekliliği olmadan tek bir hizmette toplanmıştır.

Scribe v2 Realtime

Anında konuşma işleme için optimize edilmiş konuşma tanıma sisteminin gelişmiş sürümü. Scribe v1 ile aynı 99 dili destekler, Ukraynaca dahil. Konuşmayı küçük bir gecikmeyle çeviren temel sürümden farklı olarak, gerçek zamanlı sürüm neredeyse kelimeler söylenirken metin üretir — gecikme 300 milisaniyeden azdır.

Temel özellikler:

  • Akış işleme — metin konuşulurken görünür, cümlenin bitmesini beklemez;
  • Akıllı noktalama — noktaları, virgülleri ve soru işaretlerini gerçek zamanlı olarak otomatik yerleştirir;
  • Anında düzeltme — sistem bağlamın tamamını duyduğunda cümlenin başını düzeltebilir;
  • Diyaloglar için optimizasyon — konuşma dilini, ünlemleri ve eksik cümleleri daha iyi anlar.

ElevenLabs Scribe v2 Realtime hem istemci hem de sunucu tarafında uygulanabilir. Detaylı ayarlar burada.

Platform özellikleri

Temel fonksiyonlar

ElevenLabs platformu, modern bir çağrı merkezinin tüm taleplerini kapsayan bir dizi işlev sunar. Ancak bu sadece bir özellik listesi değil — her işlev müşteri hizmetlerinde pratik uygulama açısından düşünülmüştür.

  • Text to Speech (metinden konuşmaya) — 31 dilde 5000’den fazla önceden ayarlanmış ses mevcuttur. Gerçek insanların seslerinin klonlanması ve özel ses profillerinin oluşturulması desteklenir. Uygulama: karşılamaları, yanıtları, bildirimleri seslendirme.
  • Speech to Text (konuşmadan metne) — %95-98 doğrulukla sesin metne otomatik transkripsiyonu. Tüm konuşmalar sonraki analiz için metin formatında saklanır. Özellikler: anahtar kelimelere göre arama, terimlerin frekansının istatistiksel analizi, başvuru kalıplarının belirlenmesi.
  • Voice changer (ses değiştirici) — ses parametrelerinin değiştirilmesi, ton, tını, konuşma hızı, duygusal renklendirme. Özelleştirilebilir parametreler, sesi farklı departmanlara ve kullanım senaryolarına uyarlamaya olanak tanır.
  • Voice isolator (ses yalıtıcı) — gürültü azaltma ve ana ses çıkarma teknolojisi. -30 dB’ye kadar arka plan gürültüsü filtreleme. Tipik parazitlerle çalışır: sokak gürültüsü, ofis arka planı, ev sesleri.
  • Dubbing (dublaj) — orijinalin tonlama ve temposunu koruyarak konuşmanın otomatik çevirisi. 31 dile senkronize çeviri desteklenir. Çeviri gecikmesi: 200-500 ms.
  • Sound effects (ses efektleri) — diyalogları biçimlendirmek için ses öğeleri kütüphanesi. İçerir: müzik jingleları, geçiş sesleri, bekleme sinyalleri. Kendi ses dosyalarınızı yükleme imkanı.
  • Voice cloning & design (ses klonlama ve tasarım) — 5-30 dakikalık kayıt temelinde sesin dijital kopyasının oluşturulması. MOS (Mean Opinion Score) metriğine göre reprodüksiyon doğruluğu %85-95’tir.
  • Conversational AI (konuşma AI’sı) — diyalog yürütmek için tüm bileşenlerin entegrasyonu. Bağlamsal anlama, diyalog durumu yönetimi, kesinti işleme, konuşmadaki önceki konulara dönüşü destekler.

Desteklenen formatlar

Platformun teknik esnekliği geniş ses formatları desteğinde kendini gösterir. Bu, çağrı merkezinin mevcut altyapısıyla uyumluluk için önemlidir.

PCM (Pulse Code Modulation — darbe kodu modülasyonu) — sıkıştırılmamış ses formatı. Platform tüm popüler örnekleme hızlarını destekler:

  • Klasik telefon için 8 kHz;
  • Geniş bant iletişimi için 16 kHz;
  • FM radyo kalitesi için 22.05 kHz;
  • Profesyonel ses için 24 kHz;
  • CD kalitesi için 44.1 kHz.

Bu, çağrı merkezinizin hangi ekipmanı kullandığına bakılmaksızın — eski analog PBX’lerden modern VoIP sistemlerine kadar — platformun sorunsuz çalışacağı anlamına gelir.

μ-law (mü-yasası) 8000Hz — Kuzey Amerika ve Japonya’da kullanılan telefon için klasik sıkıştırma algoritması. Çağrı merkeziniz eski sistemlerle çalışıyorsa veya belirli ülkelerin telekomünikasyon standartlarına uyması gerekiyorsa, μ-law desteği kritik önem taşır. Bu, endüstride hala yaygın olarak kullanılan geleneksel telefon ağları ve eski ekipmanlarla uyumluluğu sağlar.

Entegrasyon yöntemleri

ElevenLabs, her çağrı merkezinin kendine özgü teknik altyapısına sahip olduğunu anlar, bu nedenle birçok entegrasyon yolu sunar:

  • HTTP requestsREST API aracılığıyla evrensel yöntem. İstek gönderdiniz — yanıt aldınız. Basit ve güvenilir;
  • WebSocket — gecikme olmadan gerçek zamanlı iletişim için. Sürekli bağlantı her iki yönde anında veri aktarımı sağlar. Canlı diyaloglar için gereklidir;
  • Python SDK — Python için hazır kütüphane. Birkaç satır kodla sesli ajan oluşturma. Hızlı prototipleme ve test için kullanışlıdır;
  • Node.js libraries — JavaScript için kütüphaneler. Ajanları web uygulamalarına, CRM sistemlerine ve operatör arayüzlerine yerleştirmeye olanak tanır.

Platform modern geliştirme dilini konuşur ve herhangi bir teknik altyapıya kolayca entegre olur.

Pratik dağıtım

Sesli ajanın bağlanması, sadece botun kendisini yapılandırmaktan daha fazlasıdır. Süreç raporlama, izleme, entegrasyonlar ve tam teşekküllü bir iletişim sistemini oluşturan diğer araçları içerir.

Çalışmaya başlamak için sistemde yetkilendirme gerekir. elevenlabs.io sitesinde “Sign Up” düğmesi var. Kayıt için sadece e-posta ve şifre gerekir — uzun formlar veya kredi kartları yok. E-postayı onayladıktan sonra platforma erişim açılır.

Ajan oluşturma gösterge panelinde “Create Agent” düğmesi aracılığıyla gerçekleşir. Bu, belirli görevler için yapılandırılan temiz bir konfigürasyondur:

  • Ajan adı herhangi bir şey olabilir — “Destek Hizmeti”, “Ürün Danışmanı”. Sistem her bot için otomatik olarak benzersiz bir ID oluşturur.
  • Dil ayarları arayüzün ana dilini ve müşterilerin konuşma sırasında geçiş yapabileceği ek dilleri içerir.
  • Karşılama mesajı ajanın ilk cümlesini belirler. Alan boş bırakıldığında ajan müşteri diyaloğu başlatana kadar bekler.
  • Sistem promptu ajanın kişiliğini ve konuşma bağlamını belirler — bu AI’nın davranışını belirleyen ana talimattır.
  • Ses – temel parametrelerin ayarlanmasıyla 31 dilde 5000+ ses: Stability (duygusaldan monotona teslimat kararlılığı), Similarity Boost (orijinale yakınlık) ve sentez modeli seçimi. Belirli terimler için telaffuz sözlüğü oluşturabilir ve 5-30 dakikalık kayıttan herhangi bir sesi klonlayabilirsiniz.
  • Dinamik değişkenler – çalışma zamanı değerlerini ajan mesajlarına, sistem ipuçlarına ve araçlara yerleştirmeye olanak tanır. Bu, birden fazla ajan oluşturmadan kullanıcıya özgü verileri kullanarak her diyaloğu kişiselleştirmeye olanak tanır.
  • Knowledge base (bilgi tabanı) – dosyaları yükleyebilir veya siteye bağlantılar ekleyebilirsiniz (ücretsiz sürümde sayı sınırlıdır).
  • Retrieval-Augmented Generation (RAG) — sesli veya sohbet ajanının diyalog sırasında büyük bilgi tabanlarına erişmesine olanak tanıyan bir teknoloji. Tüm belgeyi bağlama yüklemek yerine, RAG belirli bir kullanıcı talebi için yalnızca en alakalı bilgi parçalarını çıkarır. ElevenLabs’ta bu süreç otomatikleştirilmiştir — ajan ayarlarında kaydırıcıyı hareket ettirerek etkinleştirmek yeterlidir ve bilgi tabanındaki her belge 500 baytı aşmalıdır. RAG etkinleştirildikten sonra eklenen tüm dosyalar indekslenir ve bilgi tabanı küçük parçalara (chunks) bölünür, genellikle 100-500 token. Her chunk mantıksal olarak tamamlanmış bir paragraf veya metin bölümüdür. Bu sayede ajan gerekli bilgiyi daha hızlı bulabilir ve daha doğru, bağlamsal olarak alakalı yanıtlar verebilir. Ancak RAG’ın sınırlamaları da var:
    • Hangi verilerin daha yeni veya güncel olduğunu belirlemez;
    • Belge sürümleri arasındaki çelişkileri otomatik olarak çözemez (örneğin, bir dosyada “14 gün iade süresi” diğerinde “30 gün” yazıyorsa);
    • Bilginin mantıksal tutarlılığını kontrol etmez — model çelişkili veriler alabilir ve çelişkili yanıt verebilir.
  • Araçlar – bu blok AI ajanına ek eylemler erişimi sağlar, örneğin: diyaloğu ilk bitirmek, dili belirlemek, müşteriyi başka bir AI ajanına veya operatörle bağlantı için telefon numarasına aktarmak.

“Test Agent” düğmesine bastıktan sonra tipik müşteri sorularını sorabileceğiniz konuşma simülatörü açılır. Ajan yüklenen bilgileri kullanarak yanıt verir. Sonuçta, 15 dakikada çalışan bir AI ajanı elde edilir. Bu sadece başlangıç aşamasıdır, gelecekte optimizasyon, ayarlama ve entegrasyon gerekecektir, ancak çeyrek saat sonra bir prototip elde edilebilir.

Erişim güvenliği daha az önemli bir husus değildir. Her ajanın şifre gibi saklanması gereken benzersiz bir tanımlayıcısı (Agent ID) vardır: açıkça yayınlamayın veya iletmeyin.

ElevenLabs’ta yetkisiz bağlantıyı önlemek için API anahtarları, OAuth veya JWT belirteçleri aracılığıyla kimlik doğrulamayı etkinleştirebilirsiniz. Kurumsal kullanıcılar için erişim IP adreslerine göre sınırlandırılabilir, yalnızca güvenilir ağlardan bağlantılara izin verilir.

AI ajanı nerede kullanılabilir?

Pratikte AI ajanları farklı alanlarda zaten kullanılıyor:

  • Destek hizmetlerinde operatörlerin katılımı olmadan tipik soruları çözerek başvuruları üstlenirler;
  • Perakendede kişisel danışmanlar gibi hareket ederek ürün seçimine yardımcı olur ve siparişleri takip ederler;
  • Şirketlerdeki dahili AI asistanları toplantıları hatırlatır ve gerekli belgeleri bulur;
  • Çevrimiçi eğitim alanında AI ajanları konuları açıklayan, sorular soran ve materyalin anlaşılmasını kontrol eden etkileşimli öğretmenler formatında çalışır.

Asıl önemli olan şunu anlamak — AI ajanları operatörlerin işini ellerinden almaz, onları rutinden kurtarır. Kesintiler yerine çalışanlar yeni roller alır:

  • AI eğitmenleri — AI ajanlarını eğitir ve geliştirir;
  • Workflow tasarımcıları — programlama olmadan senaryo oluşturma;
  • Eskalasyon uzmanları — sadece karmaşık vakalarla çalışma;
  • Konuşma analistleri — %2 yerine diyalogların %100’ünün analizi, ancak manuel olarak değil AI ajanları yardımıyla.

AI ajanları bir tehdit değil, çağrı merkezlerinin evriminin aracıdır. Yapay zeka ne kadar çok görevi üstlenirse, operatörlerin mekanik olarak senaryoları takip etmek yerine gerçekten önemli soruları çözmek için o kadar çok zamanı olur.

Analitik ve izleme

“İzleme, kalite kontrolü, analitik” kelimelerini duyduğumuzda aklımıza hemen operatörlerin konuşmalarını saatlerce dinleyen ve değerlendirme formlarına notlar alan süpervizör imgesi gelir.

Geleneksel kalite kontrolü — aramaların %2-5’inin seçici dinlenmesi, sonucun tamamen kontrol edenin değerlendirmesine bağlı olması. Bu pahalı, öznel ve gerçek etkileşimlerin çok küçük bir bölümünü kapsıyor. Ve burada ElevenLabs bu paradigmayı tersine çeviriyor, konuşmaların %100’ünü otomatik olarak değerlendiriyor.

Hayır, bu artık Kalite Kontrol Departmanına ihtiyacınız olmadığı anlamına gelmiyor, sadece artık süpervizörler “dinleyici” olmaktan çıkıp veri analistleri ve kalite stratejistleri haline geliyor.

ElevenLabs sistemi rutin işleri üstleniyor — her konuşmayı otomatik olarak analiz ediyor, hedeflerin yerine getirilmesini değerlendiriyor ve AI ajanının nerede başarılı olduğunu, nerede olmadığını kaydediyor.

Genel çalışma prensibi

Arama tamamlandıktan sonra ElevenLabs otomatik olarak konuşmanın transkriptini oluşturur ve ardından kendi belirlediğiniz parametrelere göre analiz eder.
Sistem neyi arayacağını “tahmin etmez” — “Analysis” bölümündeki şemanızı takip eder.
AI ajanı ayarlarında konuşmayı değerlendirmek için metrikler — Evaluation criteria ve çıkarılacak veri özellikleri — Data extraction belirleyebilirsiniz.
Böyle bir değerlendirme sistemi analizin şeffaflığını ve doğruluğunu sağlar. İnsan faktörünü ve öznel değerlendirmeleri ortadan kaldırır. Klasik Kalite Kontrol’deki seçici kontrol yerine, burada konuşmaların %100’ü analiz edilir.

Metrikler ve konuşma değerlendirmesi

(PRO tarifesinde mevcuttur)

Bölüm Analysis → Evaluation settings — kalite yönetim merkezi. Burada platformun AI ajanlarının etkinliğini ve müşteri hizmetleri kalitesini değerlendireceği sistem belirlenir. Bunlar her süpervizörün aşina olduğu değerlendirme formları, ancak artık aramaları dinleyip tabloları manuel olarak doldurmanız gerekmiyor.

Temel analitik “Pro” tarifesinden itibaren mevcuttur – sonucun ikili değerlendirmesi (başarı/başarısızlık), temel duygu analizi, üç önceden ayarlanmış kriter ve basit başarı istatistikleri. Daha pahalı tarifeleri seçerken – aracın işlevselliği genişleyecektir:

  • Scale – 1-10 ölçeğinde değerlendirme, özelleştirilebilir ağırlıklarla 20 adede kadar kriter, CSAT/NPS takibi ve başarısızlık nedenlerinin analizi;
  • Business – daha önce belirtilen tüm özellikler + A/B testleri, ajanların karşılaştırması ve otomatik öneriler;
  • Enterprise – sınırsız + kendi ML modelleri, entegrasyonlar ve tahmini başarı değerlendirmesi.

Her değerlendirme kriteri — sistemin konuşmayı değerlendireceği net bir kuraldır. İşletmenizin görevlerine bağlı olarak bir veya birkaç koşul belirleyebilirsiniz.

Örneğin:

  • “Sorun operatör katılımı olmadan çözüldü” — AI ajanı için temel gösterge. Müşteri “canlı” bir çalışana aktarılmadıysa ve çözüm aldıysa, konuşma başarılı sayılır;
  • “Müşteri çözümü onayladı” — sistem “Teşekkürler, her şey anlaşıldı”, “Evet, sorun çözüldü”, “Mükemmel, her şey çalışıyor” gibi ifadeleri arar. Bu, vakanın kapandığının işaretidir;
  • “Konuşma süresi 7 dakikadan az” — verimliliği takip etmeye yardımcı olur. Eşik herhangi bir değer olabilir, örneğin 10 veya 15 dakika;
  • “Müşterinin sonundaki duygusu — pozitif” — AI müşterinin konuşmasının tonunu belirler (kelimeler, bağlam ve ses analizi etkinleştirilmişse tonlamaya göre). Son pozitifse — artı puan.

Arama tamamlandıktan sonra, analiz süreci otomatik olarak başlar. İlk olarak sistem konuşmanın transkriptini oluşturur — diyaloğun tam metin transkripsiyonu. Sonra onu anlamsal bloklara ayırır: karşılama, detayların açıklığa kavuşturulması, çözüm arama ve iletişimin tamamlanması. Bu parçaların her biri, gerekli koşulların yerine getirilip getirilmediğini belirlemek için belirlenen değerlendirme kriterleriyle karşılaştırılır — sorun çözüldü mü, müşteri memnun kaldı mı, konuşma zaman çerçevesine sığdı mı.

Değerlendirmeden sonra sistem sadece nihai sonucu değil, aynı zamanda bunun açıklamasını da oluşturur — bir tür gerekçe. Konuşma düşük puan aldıysa, ElevenLabs tam olarak nedenini gösterir: örneğin, ajan müşterinin çözümden memnun olup olmadığını netleştirmedi, ek yardım seçeneği önermedi veya konuşmayı erken sonlandırdı. Böylece platform sadece değerlendirme yapmaz, hatanın nedenini ve iyileştirme noktasını anlamaya yardımcı olur.

Konuşmadan veri çıkarma

(PRO tarifesinde mevcuttur)

Ana ayar bölümde bulunur Agent → Analysis → Data extraction.
Burada konuşmadan tam olarak neyin çıkarılacağını açıklayan bir şema (genellikle JSON formatında) oluşturulur.

Bundan sonra her arama otomatik olarak analiz edilir — AI transkripti gözden geçirir ve bu alanları doldurur. Konuşmada gerekli bilgi yoksa, alan boş kalır.

Aslında, Data extraction — analitiğin beynidir. Neyin “veri” sayılacağını ve neyin sadece konuşma metni olacağını belirler. Araç ile çıkarabilirsiniz:

  • müşteri verileri (ad, telefon, sipariş ID);
  • başvurunun özü (“ödeme sorunu”, “özellik talebi”, “şikayet”);
  • duygular (negatif, pozitif, nötr);
  • konuşma sonucu (“sorun çözüldü”, “onay bekliyor”, “eskalasyon yapıldı”);
  • ek detaylar — ürün, şehir, iade nedeni vb.

İşlev temel bilgileri otomatik olarak tanır ve saklar: isimler, kişiler, tarihler ve 100 kelimeye kadar kısa özetler. Veriler yalnızca dahili depolamada saklanır ve CSV’ye manuel dışa aktarma imkanı vardır. Daha gelişmiş tarifeler seçildiğinde çıkarma yetenekleri önemli ölçüde genişler:

  • Scale — regex kalıplarıyla 50’ye kadar özelleştirilebilir alan, karmaşık yapıların çıkarılması (adresler, sipariş numaraları), ayrıntılı özetler ve anahtar ifadelerin otomatik belirlenmesi. Veriler webhook’lar aracılığıyla gerçek zamanlı olarak iletilir, API ve Google Sheets’e otomatik dışa aktarma mevcuttur;
  • Business — sınırsız alan sayısı, karmaşık iş nesneleriyle çalışma, multi-turn extraction (birden fazla replikten veri toplama), yerleşik doğrulama ve belgelerin OCR’si (Optical Character Recognition). CRM sistemleriyle doğrudan entegrasyon, veritabanı bağlayıcıları ve bulut depolama;
  • Enterprise — özelleştirilebilir NER modelleriyle AI tabanlı çıkarma, konuşmalar arasında veri bağlama ve kişisel verilerin otomatik işlenmesi. Herhangi bir kurumsal sistemle entegrasyon, kendi sunucularında dağıtım ve tıbbi veriler için HIPAA uyumlu depolama.

Böylece, ElevenLabs’taki Data extraction — sıradan konuşmaları sistem tarafından anlaşılan ve işletme için yararlı yapılandırılmış verilere dönüştüren bir araçtır.

Sistem analizden sonra ne yapar?

AI verileri çıkardıktan sonra, tüm bilgiler bölüme kaydedilir Evaluate → Conversations, burada belirli bir aramayı açıp sonucu detaylıca inceleyebilirsiniz. Çıkarılan bilgiler otomatik olarak yapılandırılır — sistem konuşmanın konusunu, müşterinin duygularını ve etkileşimin sonucunu gösterir.

Bundan sonra Post-call senaryoları başlatılır: ElevenLabs Zendesk, Jira veya başka bir sistemde otomatik olarak bilet oluşturabilir, CRM’de verileri güncelleyebilir, müşteriye takip mesajı gönderebilir veya daha sonraki süreçlerin özel otomasyonu için webhook’u etkinleştirebilir.

Sınırlamalar ve teknik nüanslar

  • ElevenLabs yalnızca ayarlarda belirtilenleri analiz eder, “sihirli” tanıma yoktur;
  • Bir konuşma 10.000 karaktere kadar metin analiz edilir (uzun olanlar parçalara kesilir);
  • Çıkarma için alanlar — maksimum 20;
  • Konuşma uzunluğu ve analiz için kullanılabilir işlevsellik:
    • Starter’da 10 dakikaya kadar ve yalnızca temel istatistikler;
    • Pro’da 60 dakikaya kadar – Data extraction, konuşma değerlendirmesi, Webhook’lar ve CRM entegrasyonlarını içerir;
    • Enterprise’da sınırsız- Pro sürümünde mevcut işlevselliğe genişletilmiş raporlar, API ekler;
  • Analiz aramanın bitiminden sonra 1 ila 5 dakika sürer.

Gerçek analitik işlevsellik yalnızca Pro tarifesinden itibaren görünür.

Pratikte ElevenLabs analitiği — “her şeyi kendi başına anlayan akıllı izleme” değil, tam olarak tarif edileni yapan yapılandırılabilir bir sistemdir.
Doğru alanları ve anlaşılır kriterleri belirlerseniz, konuşmaların %100’ünü analiz etmek için güçlü bir araca dönüşür. Yoksa — sadece anlamsız transkriptler oluşturur.

ElevenLabs’ta Workflow

(PRO tarifesinde mevcuttur)

Workflow — AI ajanları için karmaşık senaryolar oluşturmak için platform içindeki yerleşik görsel oluşturucu. Bu ayrı bir araç değil, birleşik ajan yönetim sisteminin bir parçasıdır.

Çalışma senaryosunu oluşturmak veya değiştirmek için Agents Platform panelini açın, istediğiniz ajanı seçin ve Workflows sekmesine gidin. Burada yeni bir senaryo oluşturmak için Create New Workflow‘a tıklayabilir veya düzenleme için mevcut olanı seçebilirsiniz.

ElevenLabs editörünün özellikleri:

    • Kodsuz sürükle-bırak arayüzü — senaryolar programlama gerektirmeden görsel olarak oluşturulur;
    • Gerçek zamanlı önizleme — ajanın belirtilen eylemleri nasıl gerçekleştireceğini hemen görebilirsiniz;
    • Test için Test Agent ile entegrasyon — gerçek aramalar olmadan senaryoyu test etmeye olanak tanır;
    • Değişikliklerin takibi — sistem değişiklikleri otomatik olarak kaydeder ve gerektiğinde önceki herhangi bir sürüme geri dönebilirsiniz.

Workflow’un mantığı ve yapısı: Conditions ve Nodes

ElevenLabs Workflow’da tüm çalışma “koşul → eylem” ilkesine göre oluşturulur. Bu sadece bir adım dizisi değil, ajanın konuşma bağlamını, müşteri durumunu ve harici sistemlerden gelen verileri analiz ederek gerçek zamanda doğru eylemi seçtiği esnek bir karar verme sistemidir.

Conditions (geçiş koşulları)

Conditions, ajanın ne zaman ve hangi koşullarda senaryonun bir sonraki adımına geçmesi gerektiğini belirler. Bu, konuşma bağlamını analiz eden ve ajan davranışını kontrol eden Workflow’un beynidir. ElevenLabs dört tür koşulu destekler:

  • LLM conditions — dil modeli (GPT, Claude, Gemini) aracılığıyla müşteri ifadesinin anlamını anlamaya dayanır. Ajan niyeti belirler, örneğin “ürünü iade etmek” veya “operatörle konuşmak” ve gerekli dalı başlatır.
  • Tool results — harici sistemin yanıtına bağlı mantık. Örneğin, API “ödeme onaylandı” döndürdü — ajan sonucu bildirir; “hata 404” — operatör yardımı önerir.
  • System variables — platformun dahili değişkenleri: konuşma süresi, dil, müşterinin duygusal tonu, günün saati vb. Örneğin: “konuşma 10 dakikadan uzun sürerse — operatöre aktar”.
  • Custom rules — bilgi tabanı veya ajan promptları aracılığıyla belirlenen kullanıcı kuralları. “İndirim belirtilirse ve müşteri sinirli ise — kupon önerin” gibi özel senaryolar eklemeye olanak tanır.

Böylece, conditions durumu analiz etmekten ve gerekli senaryoyu seçmekten sorumludur.

Nodes (eylem düğümleri)

Nodes, koşul etkinleştirildiğinde ajanın tam olarak ne yapması gerektiğini belirler. Her düğüm belirli bir eylem veya konuşma aşamasıdır.

  • Subagent node — ElevenLabs’ın benzersiz özelliği, ajan davranışını “anında” değiştirmeye olanak tanır: sesi değiştirin, başka bir LLM (GPT, Claude, Gemini) veya bilgi tabanı seçin — tüm bunlar diyaloğu kesmeden.
  • Tool node — harici sistemlerle etkileşimden sorumludur. API veya webhook’lara yapılan isteklere otomatik olarak yerleştirilen dinamik değişkenleri ({{customer_name}}, {{order_id}} vb.) destekler.
  • Transfer node — aramayı operatöre aktarmak için kullanılır. Bu durumda sistem otomatik olarak konuşmanın kısa bir özetini oluşturur ve operatörün bağlamı hemen görmesi için webhook aracılığıyla CRM veya bilet sistemine gönderir.
  • End call node — konuşmayı sonlandırır ve son işlemeyi başlatır: transkriptin kaydedilmesi, kalite değerlendirmesi ve analitik.

Workflow bir karar ağacı gibi çalışır: ajan veri alır → koşulları kontrol eder → uygun düğümü seçer → eylemi gerçekleştirir → analize geri döner.
Bu yapı senaryoları doğrusal değil, akıllıca uyarlanabilir hale getirir — ajan önceden yazılmış bir senaryoyu takip etmek yerine müşterinin gerçek niyetlerine tepki verir.

İş süreçlerinin otomasyonu kısmen Pro tarifesinden itibaren mevcuttur — temel tetikleyiciler, e-posta bildirimleri ve basit “eğer — o zaman” koşulları. Ancak kritik olarak önemli Agent Transfer işlevi (aramaları operatörlere aktarma) bu planda mevcut değildir. Gerçek olanaklar daha yüksek tarifelerde açılır:

  • Scale — anahtar kelimelere veya talep türüne göre aramaları operatörlere aktarma, kuyruk önceliklendirme. Koşullu mantıkla çok adımlı senaryolar, planlanmış eylemler, otomatik tekrar aramalar. Zapier, Make, okuma/yazma API’si, Slack ve Teams ile tam entegrasyon;
  • Business — becerilere göre yönlendirme ile çoklu ajan, yük dengeleme, yedek ajanlar. Karmaşık dallanmalar, paralel süreçler, özelleştirilebilir tetikleyiciler ve toplu işlemler. Salesforce, HubSpot, Zendesk ve herhangi bir API ile doğrudan entegrasyon;
  • Enterprise — çok kanallı yönlendirme (ses, sohbet, e-posta tek sistemde), geçmiş verilere dayalı AI yönlendirme, özelleştirilebilir eskalasyon yolları. Görsel iş süreci oluşturucu, olay tabanlı otomasyon, karmaşık entegrasyonlar için modüler mimari. SAP, Oracle, kurumsal sistemler, SSO/SAML ile entegrasyon ve özel bulutta dağıtım.

Çok kanallı iletişim

Modern müşteri tek bir iletişim kanalıyla sınırlanmak istemiyor. Sabah arıyor, öğlen sohbete yazıyor, akşam sitedeki widget üzerinden konuşuyor. Gerçek çok kanallılık — sadece farklı iletişim kanallarının varlığı değil, bunların tek bir sisteme sorunsuz entegrasyonudur.

Telefon entegrasyonları

ElevenLabs, geleneksel ofis PBX’lerinden modern bulut platformlarına kadar herhangi bir telefon sistemiyle entegre olur.

SIP Trunking — ElevenLabs, SIP protokol standartlarını destekleyen Twilio, Vonage, RingCentral, Sinch, Infobip, Telnyx, Exotel, Plivo, Bandwidth ve diğerleri dahil olmak üzere çoğu standart SIP-trunk sağlayıcısıyla uyumludur.

Teknik detaylar:

  • Desteklenen ses kodekleri: G711 8kHz veya G722 16kHz;
  • Gelişmiş güvenlik için TLS transport ve SRTP media encryption desteklenir;
  • Beyaz IP adresleri listesi gerektiren kurumsal müşteriler için statik IP’ler mevcuttur.

Twilio — hem gelen hem de giden aramaları işlemek için yerel entegrasyon.

İki tür Twilio numarası:

  1. Purchased Twilio Numbers (tam destek) – gelen ve giden aramaları destekler;
  2. Verified Caller IDs (yalnızca giden) – giden AI aramaları için mevcut iş numaralarını kullanabilirsiniz.

Telefon özellikleri

Operatöre aktarma – SIP trunking ve Twilio aracılığıyla harici telefon numaralarına aktarma desteklenir. İki aktarma yöntemi vardır: Conference Transfer ve SIP REFER

Batch Calling (toplu aramalar) – Twilio veya SIP trunking üzerinden bağlanan numaralar için mevcuttur.

ElevenLabs, SIP’yi destekleyen (modern PBX’lerin %99’u) hemen hemen her telefon sistemiyle çalışır, ekipmanı değiştirmeden AI ajanlarını bağlayabilirsiniz.

Widget Integration – sitede AI ajanı

Telefon çağrı merkezlerinin herkesin bildiği bir aracıysa, web widgets — bu bugün ve gelecek. ElevenLabs AI ajanının siteye entegrasyonunu sunuyor. Temel bilgiler o kadar basit ki teknik altyapısı olmayan bir pazarlamacı bile başa çıkabilir. Kod parçasının tüm sayfalarda widget’a erişim sağlamak için sitede <body> bölümünde ve ana <index.html> dosyasında yerleştirilmesi gerekir. Kontrol panelinde renkleri, boyutları ve widget’ın konumunu web sayfasının tasarımına uygun olarak ayarlayabilirsiniz. Daha ileri düzey kullanıcılar için ayarlar üzerinde tam kontrol için SDK mevcuttur.

Widget üç çalışma modunu destekler:

  • Voice-only konuşmayı tercih edenler için — metin girişinin rahatsız olduğu mobil cihazlarda kullanışlıdır;
  • Voice+text modaliteler arasında geçiş yapmanıza olanak tanır — sesle başlayın, gürültülü bir yerdeyken metne geçin;
  • Chat mode “sessiz” ofisler veya konuşmanın uygun olmadığı geç saatler için.

Widget temel ihtiyaçları karşılar: müşteri self servisi, potansiyel müşteri toplama ve operatör beklemeden hızlı destek. Bu artık ekranın köşesindeki bir sohbet botu değil, sitenize yerleştirilmiş tam teşekküllü bir sesli asistandır.

Her görev için optimal kanalın seçimi verimliliği artırır. Telefon, empatinin önemli olduğu karmaşık duygusal sorular için kalır ve Widget, müşterinin bilgiyi kendi bulmak istediği self servis senaryoları için idealdir.

Fiyatlandırma

ElevenLabs, işletmeyle birlikte ölçeklenen şeffaf ve öngörülebilir bir fiyatlandırma modeli sunuyor. Gizli ödemeler, karmaşık hesap makineleri veya ay sonunda beklenmedik faturalar yok.

Tarife Planları

Free

Her ay 15 dakika ücretsiz konuşma. Az görünebilir, ancak tam kapsamlı testler için yeterlidir. 15 dakika içinde 5–7 test araması yapabilir, konuşma tanıma ve sentez kalitesini kontrol edebilir, yanıt hızını değerlendirebilir ve entegrasyonları test edebilirsiniz. Birçok şirket, production’a geçmeden önce geliştirme ve test sürecinde aylarca ücretsiz planı kullanır.

Maliyet: ücretsiz

Analitik ve izleme: Kullanılan dakika sayacı, son arama geçmişi ve basit başarı istatistikleri. Detaylı analitik veya veri dışa aktarma mevcut değildir.

Workflow: Otomasyon yoktur, operatörlere çağrı aktarma imkânı yoktur, yalnızca temel konuşma kaydı yapılır.

Skill

Orta ölçekli iletişim hacmine sahip şirketler için tasarlanmıştır. Günlük olarak birkaç saatlik konuşma işleniyorsa ancak büyük bir çağrı merkezi seviyesine henüz ulaşılmadıysa, “Skill” planı en uygun seçimdir. Bu seviyedeki müşteriler avantajlı koşullar, destek, entegrasyonlar ve standart SLA’lar alır.

Maliyet: $330/ay

Analitik ve izleme:

  • Temel markalı standart raporlar ve paneller;
  • Bölümler/şubeler bazında analitik (birden fazla hesap);
  • Sınırlamalarla özelleştirilebilir metrikler ve formüller;
  • BI sistemleri ile entegrasyon (ör. Power BI);
  • Gerçek zamanlı bildirimler ve otomatik aylık raporlar;
  • Temel denetim ve uyumluluk raporlaması;

Workflow ve otomasyon:

  • Tek bir sistemde çok kanallı yönlendirme (ses, sohbet, email);
  • Geçmiş verilere dayalı AI destekli yönlendirme;
  • Yaygın iş görevleri için hazır BPMN süreç şablonları;
  • CRM/orta seviye sistemler ve API entegrasyonu (tam enterprise paketi olmadan).
Business

İşletmeler için ana çözüm. Sabit bir ücret karşılığında pakete dahil 13,750 dakika alırsınız. Bu, yaklaşık 230 saat konuşma anlamına gelir — ortalama sürede 2–3 bin çağrıyı işlemek için yeterlidir. Ek her dakika $0.08’dır.

Maliyet: $1320/ay

Analitik ve izleme:

  • Gerçek zamanlı metriklerle kapsamlı analitik;
  • Temsilciler, diller ve talep türlerine göre detaylı ayrım;
  • Özelleştirilebilir KPI’larla Success Evaluation (CSAT, FCR, AHT);
  • Data Extraction — sınırsız özel alan çıkarma;
  • Script ve prompt A/B testleri;
  • CSV’ye rapor dışa aktarma, özel paneller oluşturmak için API erişimi;

Workflow ve otomasyon:

  • Yetenek temelli (skill-based) çoklu ajan yönlendirme;
  • Karmaşık çağrıların canlı operatörlere otomatik aktarımı;
  • Salesforce, HubSpot, Zendesk ile doğrudan entegrasyon;
  • Koşullu mantık ve paralel süreçlerle gelişmiş iş akışları;
  • Veri işleme için toplu işlemler;
  • Hizmet sürekliliği için yedek ajanlar.
Enterprise

Büyük hacimli iletişime sahip şirketler için bireysel olarak geliştirilir. Günlük 6+ saat konuşma işliyorsanız (ayda 10,000+ dakika), özel koşulları görüşmek mantıklıdır. Enterprise müşterileri yalnızca daha iyi fiyatlar değil, aynı zamanda kişisel destek, bireysel SLA’lar, taleplerin öncelikli işlenmesi ve özelleştirilebilir özellikler elde eder.

Maliyet: $custom/ay

Analitik ve izleme:

  • Şirket markasına özel paneller;
  • Çeşitli departmanlar ve şubeler için çok hesaplı analitik;
  • Sınırsız özel metrikler ve hesaplama formülleri;
  • Kurumsal analitik sistemleri ile entegrasyon (ör. Tableau, Power BI);
  • Kullanıcı işlemlerinin tam geçmişi ve uyumluluk raporlaması;

İş süreçleri ve otomasyon:

  • Tek sistemde çok kanallı yönlendirme (ses, sohbet, e-posta);
  • Geçmiş verilere dayalı akıllı talep dağıtımı;
  • Olay odaklı ve mikro servis tabanlı mimari;
  • Kurumsal sistemlerle entegrasyon (SAP, Oracle ve diğerleri);
  • Kritik verilerle çalışmak için yerel kurulum seçeneği;
  • Esnek mantığa sahip özelleştirilebilir eskalasyon senaryoları;
  • Uluslararası operasyonlar için küresel yönlendirme kuralları.

Maliyet optimizasyon mekanizmaları

ElevenLabs yeni teknolojinin uygulanmasının deneyler ve ayarlamalar gerektirdiğini anlar, bu nedenle önemli ölçüde tasarruf etmenin birkaç yolunu sunar.

  • Setup & Testing modu — Tüm kurulum ve test işlemleri yarı fiyatla ücretlendirilir. Promptlarla istediğiniz kadar deneyebilir, çeşitli senaryoları test edebilir, yük testi yapabilirsiniz — ve yarı fiyat ödersiniz;
  • Duraklamaların akıllı ücretlendirilmesi — gerçek konuşmalar için çözüm. Konuşmadaki sessizlik 10 saniyeyi aştığında, platform turn-taking ve speech-to-text modellerinin çalışma yoğunluğunu otomatik olarak azaltır. Bu sessizlik dönemleri normal maliyetin sadece %5’i oranında ücretlendirilir. Müşteri belge aramaya 2 dakika gitti mi? 6 saniye olarak ödeyeceksiniz. Gerçek konuşmalarda duraklamalar zamanın %20-30’unu oluşturur, bu da önemli tasarruf sağlar.
  • Metin modu optimizasyon için büyük fırsatlar açar. Yalnızca sohbet konuşmaları sesli olanlara göre 25 kat daha yüksek eşzamanlılık limitlerine sahiptir. Planınız 20 eşzamanlı sesli aramaya izin veriyorsa, metin sohbetleri 500 olabilir. “Bakiye öğrenme” veya “sipariş durumu” gibi basit talepler için metin modu idealdir — hızlı, ucuz, etkili.

Ek maliyetler

Platformun dürüstçe uyardığı ek maliyetler dahil olmak üzere maliyetlerin tam resmini anlamak önemlidir.

  • LLM costs (dil modelleri maliyetleri) geçiş fiyatlandırma (pass-through pricing) ilkesine göre çalışır. Ana ElevenLabs abonelik faturanıza, seçilen modelin sağlayıcısının resmi tarifelerine göre hesaplanan kullanılan LLM token maliyeti otomatik olarak eklenir. İhtiyaçlarınıza bağlı olarak seçebilirsiniz: OpenAI’den GPT-4 — konuşma dakikası başına yaklaşık $0.01-0.03 ekler, kalite ve maliyetin optimal dengesi. Anthropic’ten Claude daha pahalı olabilir, ancak daha kaliteli yanıtlar sağlar. Google Gemini genellikle en ekonomik seçenektir.
    Gönderilen ve alınan tokenlerin sayısı ve maliyeti her konuşma için ayrı ayrı takip edilebilir — bilgi konuşmanın meta verilerinde gösterilir;
  • Çok modlu mod — müşteri aynı konuşmada hem konuşup hem yazabildiğinde. Örneğin, sesle başladı, sonra metne geçti (metroya girdi), sonra tekrar sesle. Ödeme nasıl hesaplanır: ses — konuşma dakikaları için ödeme, metin — her mesaj için ödeme.

ElevenLabs — ayların geliştirmesini birkaç haftalık yapılandırmaya dönüştürebilen sesli AI ajanları oluşturmak için hazır bir ekosistem. Platform başlatma hızını, şeffaf fiyatlandırmayı ve kurumsal düzeyde güçlü işlevselliği birleştirirken, herhangi bir ölçekteki işletme için erişilebilir kalıyor.
“Kutudan çıkar çıkmaz” mucizeler yapmaz — yetkin yapılandırma, kaliteli bilgi tabanı ve düzenli optimizasyon gerektirir. Ancak doğru kurulumla ElevenLabs, rutini üstlenen güvenilir bir dijital çalışana dönüşür, insanlara empati ve yaratıcılığın önemli olduğu görevleri bırakır.

ElevenLabs, sesli AI teknolojilerinin deneylerden yönetilebilir çözümlere nasıl geçtiğini gösteriyor. Bu, makinenin insanı değiştirmediği, onun yardımcısı olduğu yeni bir iletişim mimarisine doğru bir adımdır.

 

Haberleri derecelendirin:

Ayrıca okuyun

photo
Salı Kasım 5th, 2024 Sesli konuşma tanıma: Çağrı merkezinin verimliliğini nasıl artırabilirsiniz

Konuşma tanıma” özelliği, agentları tekdüze müşteri anketi projelerinden kurtarır. Oki-Toki tarifeleri hakkında bilgi edinin

Daha fazla detay
photo
Perşembe Ocak 23rd, 2020 Otomatik arama ile borçluları arama: Borçluların aranmasını nasıl otomatize edebilirsiniz?

Bu makalede, alacaklıların manuel olarak aranmasından neden kaçınılması gerektiğini ve çağrı merkezinin hangi araçlarının süreci otomatize etmeye yardımcı olacağını anlatacağız.

Daha fazla detay