Claude Science açık beta
(claude.com)- Claude Science, yaşam bilimleri araştırmacılarının analiz çalıştırma, veritabanı arama, veri ön işleme ve sonuç yazımını tek bir çalışma tezgâhında kesintisiz sürdürmesi için hazırlanmış açık beta bir uygulamadır
- Görseller, tablolar ve notebook'lar; üretilen kodu, çalışma ortamını ve konuşma geçmişini birlikte saklayarak daha sonra yeniden üretme, düzenleme ve doğrulama olanağı sağlar
- Yerel notebook, Linux cihazları, HPC giriş düğümü ve bulut VM üzerinde çalışır; SSH, Slurm ve Modal üzerinden iş gönderimi ve yönetimini destekler
- Genomik, tek hücre, proteomik, yapısal biyoloji ve kimyasal bilişim alanlarını hedefler; 60'tan fazla bilimsel veritabanına ve NVIDIA BioNeMo araçlarına bağlanabilir
- macOS ve Linux'ta Pro, Max, Team ve Enterprise planlarıyla kullanılabilir; ancak beta uygulama olduğu için kurumsal dağıtımdan önce belgelerin incelenmesi ve yönetici ayarlarının yapılması gerekir
Bilimsel araştırma için Claude çalışma tezgâhı
- Claude Science, yeni bir model değil, açık beta bir uygulamadır ve kullanıcının planına dahil olan mevcut Claude modellerini kullanır
- Yeni eklenen kısım, Claude'un çevresindeki bilimsel araçlar, veritabanı bağlantıları ve hesaplama entegrasyonudur; böylece tüm analiz kullanıcı altyapısında çalıştırılabilir
- macOS ve Linux için sunulur ve sayfada her işletim sistemi için indirme bağlantıları yer alır
- Amaç; bilimsel veritabanlarını, araştırma araçlarını, ELN'yi, protein ve yapı modellerini, HPC'yi tek bir araştırma çalışma tezgâhında bir araya getirmektir
Yeniden üretilebilir çıktılar ve inceleme akışı
- Claude Science; proteinleri, yapıları ve molekülleri yerel olarak görüntüleyebilir ve sonuçları üretilen koda kadar izlenebilir hale getirir
- Görseller, tablolar ve notebook'larla birlikte şu bilgiler saklanır
- Sonucu üreten tam kod
- Çalışma ortamı
- Sonucu oluşturan konuşma
- Kaydedilen çıktılar aylar sonra bile yeniden üretilebilir, düzenlenebilir ve savunulabilir
- Proteinler, hizalamalar, genomik izler, kimyasal yapılar ve PDF'ler ek kurulum gerekmeksizin yerel biçimde görüntülenebilir
- Arka plan inceleyicisi, hatalı alıntıları, izlenemeyen sayıları ve temel kodla uyuşmayan görselleri işaretler
- Kullanıcılar görsellere açıklama ekleyerek düzeltme veya soru talep edebilir; ajan ise ilgili görseli üreten kodu okuyup doğrudan düzenler
- Analiz sonuçlarının yazımı, işlenmiş Markdown ve LaTeX önizlemesi izlenerek yapılabilir
Hesaplama ve çalışma ortamı
- Her analiz için gerekli çalışma ortamını yönetir; çalıştırma konumu notebook, Linux cihazı veya HPC giriş düğümü olabilir
- Batch script yazıldıktan sonra kullanıcının makinesine veya HPC kümesine SSH ile gönderilip yönetilebilir ya da işler Modal hesabında çalıştırılabilir
- Kurulum yeri, verinin bulunduğu konuma göre ayarlanabilir
- Notebook
- Laboratuvar Linux cihazı
- HPC giriş düğümü
- Bulut VM
- Tarayıcı üzerinden bağlanarak kullanılabilir
- İşler; yerel kernel'de, SSH üzerinden Slurm kümesinde veya Modal hesabında çalışır
- Değişkenler, veri çerçeveleri ve yüklenmiş modeller analiz boyunca bellekte tutulur; böylece yinelemeli çalışmalar daha hızlı ilerler
Yaşam bilimleri alanlarına göre işler
- Claude Science; genomik, tek hücre, proteomik, yapısal biyoloji ve kimyasal bilişim gibi alanları destekler; literatür okuyabilir ve 60'tan fazla bilimsel veritabanını sorgulayabilir
- Başlıca kullanım örnekleri şunlardır
- Single-cell RNA-seq analizi: Tüm bir dokudaki milyonlarca hücreyi kümeleyip anotasyonlar, yüzey belirteç genlerini bulur ve her görseli üretilen koda kadar izler
- Filogeni ve evrim analizi: ortholog hizalama, maksimum olabilirlik ağaç çıkarımı ve işlevsel kalıntıların filogenetik haritalanmasını tek bir yeniden üretilebilir oturumda yürütür
- Protein yapısı ve dil modeli çalışmaları: Tahmin edilen yapıları getirir, üzerine domain ve klinik varyantları bindirir ve bunları 3D ortamda etkileşimli olarak keşfeder
- Kimyasal bilişim ve moleküler tasarım: Biyoaktivite verilerini arar, özellik ve benzerlik hesaplar, 2D çizim aracında yapıları çizer veya düzenler
- Pipeline'lar yeniden kullanılabilir skill olarak kaydedilebilir; laboratuvarın tercih ettiği araçlar connector ile bağlanarak sonraki oturumlarda otomatik kullanılabilir
- Tam kaynaklı indication dossier sunar ve her programın dayandığı skill set'ini genişletmeyi sürdürür
Mevcut laboratuvar yığınıyla bağlantı
- Connector, dahili API'leri, ELN'yi ve özel pipeline'ları iş akışına getirerek Claude Science'ın laboratuvarın mevcut araçlarıyla birlikte çalışmasını sağlar
- Mevcut Python, R ve shell iş akışları sıfırdan yeniden kurulmadan okunabilir, çalıştırılabilir ve genişletilebilir
- Bilimsel araçlar, platformlar ve alana özgü açık modeller; skill veya connector olarak eklenti şeklinde bağlanabilir
- Claude Science, belirli bir aracı değiştirmekten çok uzman araçların birlikte çalıştığı bütünleşik bir çalışma tezgâhı rolünü üstlenir
Model, araç ve veri bağlantıları
- Genel yapay zeka asistanlarının biyolojiyi tartışma düzeyinin ötesinde, Claude Science; pipeline çalıştırmayı, bilimsel veritabanı keşfini, küme işlerinin orkestrasyonunu ve önceki oturum kayıtlarının takibini destekler
- Uygulama; genomik, tek hücre, proteomik, yapısal biyoloji ve kimyasal bilişim gibi alanlar için analiz specialist'leri içerir
- Alana özgü açık modellere ve 60'tan fazla bilimsel veritabanına yerel olarak bağlanabilir
- NVIDIA'nın BioNeMo Agent Toolkit skill'i kullanılarak BioNeMo yaşam bilimleri modelleri ve kütüphanelerine bağlanılır
- Dahil edilen örnekler arasında Evo 2, Boltz-2 ve OpenFold3 bulunur
Veri konumu ve doğrulama
- Claude Science uygulaması kullanıcının altyapısında çalışır; ham veri setleri ve hesaplama yerelde kalır
- Prompt'lara ve model yanıtlarına dahil edilen içerik, Anthropic'in standart saklama politikasına göre işlenir
- Takıma özgü gereksinimler satış ekibiyle iletişim kurularak görüşülebilir
- Tüm çıktılar şu bilgileri içerir
- Üretimde kullanılan tam kod
- Çalışma ortamı
- Yapılan işin düz metin açıklaması
- Sonuca götüren konuşma
- Arka plan inceleyicisi, sonuçlar gösterilmeden önce kanıtla izlenemeyen iddiaları işaretler
Planlar, laboratuvar indirimi ve kurumsal dağıtım
- Claude Science, macOS ve Linux'ta Pro, Max, Team ve Enterprise planlarıyla sunulan bir beta uygulamadır
- Team ve Enterprise kullanıcıları için önce yöneticinin etkinleştirme yapması gerekir
- Araştırma laboratuvarları için indirimli Claude Team plan for research labs, Claude Science uygulamasına erişim içerir
- Hedef kitle; akademik kurumlar ve kâr amacı gütmeyen araştırma kuruluşlarındaki aktif bilimsel araştırma laboratuvarlarıdır
- Biyomedikal ve temel bilim laboratuvarları ile kimya, matematik, bilgisayar bilimi, fizik gibi hard sciences alanları öncelik kapsamındadır
- Uygunluk, laboratuvar sorumlusu üzerinden doğrulanır
- Ticari şirketler, sözleşmeli araştırma kuruluşları ve endüstriyel Ar-Ge ekipleri Team and Enterprise plans sayfasına bakmalıdır
- Enterprise planı SSO, SCIM provisioning, özel roller ve kullanım analitiği sunar
- Beta aşamasında olduğu için yöneticiler dağıtımdan önce belgeleri incelemelidir
- Belgeler, kurulum, araç ve hesaplama bağlantıları ile Team ve Enterprise yönetici ayarlarını kapsar
1 yorum
Hacker News yorumları
Bu sürümde yer alan bağlantı araçlarından biri olan Biomni HPC’yi ben yaptım ve bu sorunla epey uzun süredir uğraşıyorum. Anthropic’te de çalıştım ama bu üründen ben sorumlu değildim.
Diğer yorumlarda söylendiği gibi bu, veri bilimi için; ancak grafik çizip makale yazmaktan daha fazlasını yapabiliyor. Araştırmacının kurum kümesi de dahil olmak üzere çeşitli veritabanları ve hesaplama araçlarıyla entegre oluyor.
Tek başına bu bile çok değerli. Bir biyoteknoloji girişiminde bu sorunla boğuşurken kendi girişimimi kurdum; bu tür araç ve veritabanı entegrasyonları zor ve çok zaman alıyor. Bu ürünün tek çıktısı LLM’ler için harika bir API inşa etmek olsa bile büyük ve olumlu bir etkisi olur. Hesaplamalı genomikte kullanılan birçok veritabanına hâlâ yalnızca FTP üzerinden erişilebiliyor.
LLM’ler bu araçları ve veritabanlarını keşfetmeye özellikle uygun. Çok uzmanlık gerektiren ama bağlam içinde öğrenilen becerilerle ele alınması kolay birçok basit görev var. Eski müşterilerim olan biyoinformatikçilerin LLM’lerle bu sorunu çözmeye başladığını görünce 2024’te Anthropic’e katıldım.
Ayrıca bu örüntü özünde yalnızca veri bilimine bağlı değil. Bazı bilim alanlarında ıslak laboratuvarlarla veya CRO’larla da entegre edilebilir; şu sıralar zamanımı buna ayırıyorum.
Bu şekilde yapılan bilim her şeyi çözmez, ama belirli alanlarda faydalıdır. Örneğin birçok nadir hastalık araştırmasında ilerleme, temel bir atılımdan çok araştırmacı ilgisi darboğazı nedeniyle yavaşlıyor.
https://x.com/phylo_bio/article/2029233694775624096
Karşılaştırmak gerekirse OpenAI’ın bilim ürünü Prism, aslında Crixet satın alımıyla elde edilen bir LaTeX editörüne daha yakındı.
Kurum politikalarına, ilgili yasalara, NIH veri depoları gibi veri erişimi ve saklama gereksinimlerine uymak gerekir; ayrıca kurum ile yapay zeka sağlayıcısı arasında hukuki sözleşmeler de gerekebilir. En azından şimdilik el atması zor.
İlgilenirseniz konuşabiliriz.
Buradaki en ilginç nokta, Claude Science’ın yerel bir sunucu çalıştırması ve tarayıcıda bu sunucuya bağlanan web tabanlı bir UI sunması.
Bu, UI’ın ana makineye daha sıkı bağlandığı ve bilgisayar kullanımı gibi özellikleri mümkün kılan Claude Code veya Cowork gibi yapılardan epey farklı.
Stratejiyi anlamak mümkün gibi. İlginç verilere bağlı çoğu ilaç araştırma ortamı çok sıkı şekilde kilitlidir; bir MacBook’u kaynak veriye öylece bağlayamazsınız.
Benzer şekilde UK Biobank veya NIH All of Us gibi büyük genomik biyobanka veri kümelerine erişime yalnızca Trusted Research Environment (TRE) adı verilen uzaktan veri analizi platformları üzerinden izin verilir ve genellikle internet erişimi de kısıtlıdır. Masaüstü uygulaması çalıştırmak kolay değildir; ama bu ortamlar çoğunlukla JupyterLab veya VS Code çalıştırmayı ve UI’ı son kullanıcıya tünellemeyi destekler. Daha önce All of Us TRE’yi yapan ekibe liderlik etmiştim.
Claude Science’ı, her şeyi yapan dev bir Claude uygulamasından ziyade, bu tür kısıtlı veri ortamlarının içinde bir sunucu ayağa kaldırıp yalnızca UI’ı kullanıcının tarayıcısına proxy eden bir şey olarak hayal etmek daha kolay. İlaç Ar-Ge ortamlarında benimsenmesi için bu önemli olacaktır.
Öte yandan RStudio, JupyterLab ve VS Code’u her gün kullanan orta seviye hesaplamalı bilim insanları için Claude Science oldukça yabancı bir ürün biçimi olabilir. Mevcut veri bilimi tezgâh araçlarının yerini mi alacak, onlarla birlikte mi kullanılacak, yoksa sonunda onları saran bir katmana mı dönüşecek, merak ediyorum.
Bir jeoloji şirketinde veri analisti olarak ilginç sensör verileriyle çalışıyorum; hızlı analiz veya görselleştirme gerektiğinde Claude, benim yaklaşık bir saatte toparlayacağım kodu birkaç dakikada yazıyor. İlgili kütüphaneleri kodu okuyup doğrulayabilecek kadar bilmek, kara kutu yapay zekayı körü körüne kullanmaktan önemli bir fark.
Ancak şu anda Claude Code ile VS Code’un Jupyter’i pek iyi uyuşmuyor. Claude her düzenleme yaptığında tüm notebook’u baştan çalıştırmaya zorluyor. Bu yüzden notebook’lardan bir adım geri çekilip Claude’un bağımsız script’ler yazmasını sağlıyor, daha sonra bunları güzel bir notebook’a yeniden birleştirmek için zaman harcıyorum.
Mac’ten bağlanamıyorsanız, sunucudaki ajanın istek göndermesine de izin verilmeme ihtimali yüksek.
Kendi alanım olan RNAi tabanlı biyopestisitlerin hesaplamalı tasarımında nasıl sonuç verdiğini denedim
Batı mısır kök kurdunun DvSnf7 transkriptini hedefleyen bir tasarımı tek seferde oluşturttum; yaklaşım epey safçaydı. Doktoranın 1. yılındaki birinin yapacağı türdendi ama işi yaptı
Memeli tasarım kurallarını kullanmış olması veya off-target kontrolünün sınırlı olması gibi kısıtları da belirtti. Çok kötü değil ama harika da değil. Kusurları işaret edince yapay zekanın daha iyi bildiği ve yaklaşımını buna göre kurabileceği sonucuna vardım. Sonra Opus 4.8 güvenlik sistemi oturumu işaretledi
Bu konudaki 10 temel makaleyi ve alanın 10 genel ders kitabını toplayıp OCR ya da metin çıkarma ile düz metne dönüştürmenizi, ardından omp.sh gibi daha iyi bir ajan harness’iyle aynı işi denemenizi öneririm
/goal set create biopesticide targeting the DvSnf7 transcript of western corn rootwormHata yapmayın
“Science” dendiğinde veri bilimi kastedildiğini düşünmemiştim ama pandas kodu ve grafiklerle dolu arayüz öyle görünüyor
Bilim alanlarına odaklansa bile Jupyter Notebook 2.0 gibi göründüğünü de hesaba katınca, duyurunun daha az değerli kısmı olabilir
Veri görselleştirmelerini görüntü olarak anlama kullanım senaryosu şimdiye kadar göz ardı edildi ve güncel LLM’ler düzgün keşifsel veri analizinde de giderek iyileşiyor. Yine de özgeçmişimi güncellemem gerekebilir
Gördüklerime bakarsam matematik, fizik, biyoloji ve dilbilim insanlarının yazdığı kod yerine Claude’un ürettiği kodu her zaman seçerim. Claude’un veri analizi sırasında çok büyük hatalar yaptığını da gördüm, ama hâlihazırda kod yazan akademisyenlerin çoğundan daha güvenilir olma ihtimali var
Hangi bilim olduğu, araç zincirinden değil ele alınan konudan anlaşılır
LLM’lerden önce takip ettiğim teknik gruplar, hangi konunun ne zaman ve ne için kullanılacağı üzerine hararetle tartışırdı; bence bu tartışmalar “makul bir fikir gibi, uygulamaktan zarar gelmez” tarzında birçok framework ve araç doğurdu
Ne yazık ki bugünlerde her şey LLM’lerin etrafında dönüyor ve yalnızca LLM’leri bir şekilde çalıştırmanın yolları konuşuluyor. O grupların en başta tartışmak için kurulduğu konuların kendisi neredeyse hiç ele alınmıyor
Bilimin de yakında aynı şeyi yaşayacağından korkuyorum. Asıl tartışılması gereken konuların yerini LLM muhabbeti alabilir
Mevcut varlıklardan bir şekilde yararlanılamazsa yatırılan sermayenin getirisi iyi görünmez
Bunu savunduğumdan değil; sonuçta yöneticilerin bu getiri metriklerine bakan hissedarlara hesap vermek zorunda olduğunu söylüyorum
Bu duyuru sayesinde Linux için Claude Desktop açılmış gibi: https://code.claude.com/docs/en/desktop-linux
Benzer araçları kullandım; etkileyici olsalar da LLM çok sık sahte ama inandırıcı veriler üretip bunları gerçekmiş gibi sunuyor
Doğru yerlerden veri alıyormuş gibi görünmesi için sahte veritabanı bağlayıcıları bile kuruyor; ama aslında sentetik veri kullanan epey derin düzeyde bir manipülasyon da içeriyor
Bu ürünün bunu nasıl engellediğini merak ediyorum
Biyobilim tarafına gidince LLM’leri yozlaşmış model gibi yapan şirket bu değil miydi?
Bilim için Claude Cowork gibi bir şey mi, yani teknolojiye daha az aşina kullanıcılar için bir ürün mü, merak ediyorum
Kodlama geçmişi olan bir bilim insanı muhtemelen sadece Claude Code’u genel amaçlı kullanmayı ve kendi seçtiği stack ile entegre etmeyi tercih eder; ama Claude Science’ın rahatlığı ve kullanılabilirliği sonunda galip gelebilir
Eskiden bulunduğum ulusal laboratuvar ekibinin bunu sisteme entegre edip Claude Code kullanmayı tamamen bırakmasını rahatlıkla hayal edebiliyorum
Adının Claude-bio-big-bucks olması gerektiğini düşünüyorum
Yerbilimleri, fizik ve mühendislik ne olacak? Bağlayıcıların ve teknolojinin hepsi biyoloji ve ilaç tarafında
Trump öncesi ölçekte NSF’nin yıllık bütçesi yaklaşık 6-8 milyar dolardı, NIH’nin yıllık bütçesi ise yaklaşık 50 milyar dolardı. Fark tam olarak bu