엔비디아가 텐서RT-LLM(TensorRT-LLM) 업데이트를 통해 인공지능(AI) 추론 성능을 향상하고 새로운 대규모 언어 모델 지원을 추가한다고 15일(현지시간) 밝혔다. 더불어 VRAM 8GB 이상 RTX GPU가 탑재된 데스크톱과 노트북에서 까다로운 AI 워크로드에 대한 보다 쉬운 액세스를 지원할 계획이다.윈도우(Windows) 11 PC의 AI는 테크 분야에 있어 획기적인 전환점이다. 이는 게이머, 크리에이터, 스트리머, 직장인, 학생은 물론이고 일반 PC 사용자에게도 혁신적인 경험을 제공한다.AI 탑재를 통해 1억 대가
델 테크놀로지스(Dell Technologies)가 허깅페이스(Hugging Face)와 협력해 업계를 선도하는 델의 인프라 솔루션과 허깅 페이스 커뮤니티를 활용해, 손쉽게 오픈소스 생성 AI를 구축하고, 미세 조정하여, 운영할 수 있도록 지원할 계획이라고 14일(현지시간) 밝혔다.‘허깅페이스’는 머신러닝 모델을 구축, 배포 및 교육하기 위한 도구와 리소스를 개발하는 프랑스계 미국 회사이자 오픈 소스 커뮤니티로, 양사는 허깅페이스 플랫폼에 델 포털(Dell Portal)을 구축해서 업계에서 가장 많이 판매된 델의 인프라 솔루션에 맞
세계적인 임베디드 개발용 소프트웨어 및 서비스 공급회사인 IAR은 Arm용 IAR 임베디드 워크벤치(IAR Embedded Workbench for Arm)의 최신 배포판인 버전 9.40.2에서 르네사스(Renesas)의 RA8 MCU(Micro Controller Unit)를 완벽하게 지원한다고 7일(현지시간) 발표했다. 이번 업데이트는 최첨단 Arm® 코어텍스-M85(Cortex®-M85) 기반 RA8 디바이스에 대한 광범위한 지원을 제공한다. 이를 통해 개발자는 Arm의 헬륨 기술과 IAR 임베디드 워크벤치의 최적화를 통해 인
삼성전자가 8일, 삼성전자 서울R&D캠퍼스에서 열린 '삼성 AI 포럼 2023'을 통해 생성 AI 모델 '삼성 가우스(Samsung Gauss)'를 최초 공개했다. 삼성전자는 '삼성 가우스'를 활용해 회사 내 업무 혁신을 추진하고 나아가 사람들의 일상에 새로운 경험을 제공하기 위해 생성형 AI 기술을 발전시킨다는 계획이다.삼성리서치에서 개발한 이 모델 '삼성 가우스''는 정규분포 이론을 정립한 천재 수학자 칼 프리드리히 가우스(Carl Friedrich Gauss)로부터 영감을 얻은 생성형 AI 모델로, 삼성이 추구하는 생성형 AI
아마존웹서비스(Amazon Web Services, 이하 AWS)가 엔비디아(NVIDIA)와 협력을 통해 차세대 머신러닝(ML) 워크로드용 아마존 EC2 캐퍼시티 블록(Amazon Elastic Compute Cloud Capacity Blocks)에 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)를 탑재한다.이를 통해 고객들은 아마존 일래스틱 컴퓨트 클라우드(EC2)로 고성능 머신러닝 워크로드용 아마존 EC2 울트라클러스터(UltraCluster)에 구축된 수백 개의 엔비디아 GPU를 확보할 수 있다.
글로벌 오픈소스 솔루션 선도기업 레드햇(Red Hat, Inc.)이 엔터프라이즈 IT 자동화의 가속화를 지원하는 생성 AI 서비스 ‘레드햇 앤서블 라이트스피드 위드 IBM 왓슨x 코드 어시스턴트(Red Hat Ansible Lightspeed with IBM watsonx Code Assistant)’를 정식 출시했다.레드햇 앤서블 라이트스피드는 사용자 프롬프트를 토대로 코드를 추천한다. 그리고 IBM 왓슨x 코드 어시스턴트와 통합해 IBM 파운데이션 모델에 액세스하고, 앤서블 자동화 콘텐츠를 신속하게 구축한다. 앤서블을 위한 특수
SAP는 현지시간 2일, 3일 양일간 인도 방갈로르 국제전시센터에서 열린 'SAP 테크에드 2023(SAP TechEd Bangalore)'에서 인공지능(AI) 시대의 모든 개발자가 비즈니스를 더욱 강화할 수 있도록 돕는 다양한 혁신을 공개하고 생성 AI 애플리케이션 개발 및 벡터 데이터베이스 기능 부문 혁신을 소개했다.위르겐 뮐러(Juergen Mueller) SAP 최고기술책임자는 “오늘날의 역동적인 기술과 비즈니스 환경은 모든 개발자가 AI 개발자로 거듭나야 한다는 것을 의미한다”며 “AI가 탑재된 프로코드(pro-code)
지난 4월, 알리바바그룹(Alibaba)의 디지털 기술 및 인텔리전스의 중추 알리바바 클라우드가 대규모 언어 모델(LLM)이자 생성 인공지능((generative AI) 모델 ‘통이치엔원(通义千问, Tongyi Qianwen)’을 발표(본지보도 참조), 6월에는 통이치엔원을 AI 구동 미팅 어시스턴트인 ‘팅우(Tingwu)’와 결합해(본지보도 참조) 멀티미디어 콘텐츠들을 보다 높은 정확성과 효율성으로 이해하고 분석하는 것이 가능해졌다. 이후 7월, AI 이미지 생성 모델 ‘통이 완샹’ 및 AI 오픈소스 플랫폼 '모델스코프(참조)'를
KT(대표 김영섭)가 31일, 서울 서초구 KT 연구개발센터에서 기자설명회를 통해 초거대 인공지능(AI) ‘믿음(Mi:dm)’의 출시를 발표했다. 모델은 총 4종으로, 경량 모델부터 초대형 모델에 이르기까지 기업의규모와 사용 목적에 맞게 완전 맞춤형(Full Fine-Tuning)으로 사용할 수 있도록 했다. 또한 AI 풀스택을 통해 KT클라우드와 함께 믿음의 기업전용 AI 클라우드팜(Mi:dm CloudFarm)을 패키지로 제공해, 별도 개발 및 학습 인프라가 없더라도 누구나 합리적인 비용으로 초거대 AI를 활용한 서비스를 개발할
한국전자통신연구원(이하 ETRI)가 과학기술정보통신부(이하 과기정통부)와 정보통신기획평가원(이하 IITP)의 지원을 받아 개발한 노코드 머신러닝 개발도구(MLOps)의 핵심기술을 오픈소스로 공개하고, 깃허브 커뮤니티 확산을 위한 공개 세미나를 1일 과학기술회관에서 개최한다.ETRI 연구진은 2021년부터 공장, 의료 등 산업 분야에서 인공지능 전문지식이 부족한 사용자들도 노코드 기반으로 신경망을 자동생성하고 배포 과정까지 자동화하는 탱고(TANGO) 프레임워크를 개발하고 있으며, 작년부터 핵심기술을 오픈소스로 공개하고 있다. '탱고
전 세계적인 챗GPT를 비롯한 생성형 AI의 이슈 곳에 인공지능 기술이 사회 전반에 걸쳐 광범위하게 활용되며 인간의 삶에 많은 영향을 미치고 있다.최근 AI의 긍정적인 효과 이면에 범죄자의 재범 예측을 위해 머신러닝 학습에 사용되는 콤파스(COMPAS) 시스템을 기반으로 학습된 모델이 인종 별로 서로 다른 재범 확률을 부여할 수 있다는 심각한 편향성이 관찰되었다.이 밖에도 채용, 대출 시스템 등 사회의 중요 영역에서 인공지능의 다양한 편향성 문제가 밝혀지며, 공정성(fairness)을 고려한 머신러닝 학습의 필요성이 커지고 있다.여
이미지 생성 AI는 사용자가 텍스트 또는 음성으로 입력(요청)하면 진짜 사진과 구별할 수 없는 사실적인 이미지를 만들어준다.에브리픽셀 저널(Everypixel Journal) 지난 8월 발표에 따르면 사진가들이 1826년에 처음 촬영한 시점부터 1975년까지 150억 장에 도달하는 데 150년이 걸렸지만 작년부터 텍스트-이미지 생성 AI 알고리즘을 사용하여 1년여 동안 무려 150억 개 이상의 이미지가 생성되었다고 한다.DALLE-2 출시 이후 사람들은 하루 평균 3,400만 개의 이미지를 생성하고 있다. 가장 빠르게 성장하는 제품
AMD는 초저지연 전자 트레이딩 애플리케이션용으로 설계된 새로운 핀테크 가속기인 AMD 알베오(Alveo™) UL3524 가속기 카드를 발표했다. 알베오 UL3524는 이미 선도적인 트레이딩 기업에 의해 구축되어 여러 솔루션 파트너 제품이 지원되고 있으며, 프랍 트레이더(Proprietary Trader)와 투자전문기관, 헤지 펀드, 중개 및 거래소 등에 나노초(ns) 단위 속도의 전자 트레이딩을 위한 최첨단 FPGA 플랫폼을 제공한다.특히, AMD는 알고리즘 기반 트레이딩 시장에서 인공지능(AI) 채택을 보다 간소화할 수 있도록
국내 태양광 발전 설비는 친환경 발전을 통한 에너지 수요 대응을 위해 매년 증가하고 있으며, 앞으로도 국가 탄소중립 실현 목표에 따라 계속 늘어날 전망이다. 그러나 설비가 늘어난 만큼 최상의 상태를 유지하기 위한 유지관리(O&M) 기술도 필요하다.태양광 설비는 구축 이후 평균 20년 이상 유지될 수 있는데, 적절한 유지관리가 이루어지지 않으면 패널 하나의 작은 고장이 10배, 30배 이상의 손실을 일으키는 ‘태양광 미스매칭 손실’을 야기하기 때문이다.기존의 태양광 설비 유지보수 방식은 주기적으로 인력을 투입해 현장에서 고장을 진단하
최근 유전공학 기술의 발전으로 형광현미경을 활용해 살아있는 생체조직 내 신호를 형광신호1로 변환하여 연속적으로 촬영하고 측정하는 기술들이 개발되어 활용되고 있다.그러나, 생체조직에서 방출되는 형광신호(특정 생체 신호의 변화에 비례하여 빛/형광의 밝기가 변화)가 미약하기 때문에 빠르게 변화하는 신경세포의 전기신호 등의 신호를 측정할 경우, 매우 낮은 신호대잡음비를 가지게 되어 정밀한 측정이 어려워지게 된다.여기에, KAIST(총장 이광형)는 전기및전자공학부 윤영규 교수 연구팀이 기존 기술 대비 10배 이상 정밀하게 생체 형광 신호 측
업스테이지가 글로벌 생성AI 대표 기업들과 어깨를 나란히 했다.국내 대표 AI 스타트업 업스테이지(대표 김성훈)는 자사 LLM 모델 ‘SOLAR’(이하 솔라)가 글로벌 생성 AI 활용 플랫폼 ‘Poe’에 메인 모델로 등록됐다고 18일 밝혔다.업스테이지 솔라는 ‘Specialized and Optimized Llm and Applications with Reliability’의 약자로, 업스테이지는 챗GPT를 뛰어넘은 자사의 허깅페이스 1위 모델을 기반으로 솔라를 개발했다.Poe는 글로벌 지식 서비스 쿼라가 운영하고 있으며, 다양한
인공지능(AI) 컴퓨팅과 관련 추론 알고리즘이 네트워크 엣지에 급속도로 도입됨에 따라 인텔리전트 하드웨어 코리아(Intelligent Hardware Korea. 이하, IHWK)는 뉴로테크놀로지(neurotechnology) 디바이스 및 필드 프로그래머블 뉴로모픽(neuromorphic) 디바이스를 위한 뉴로모픽 컴퓨팅 플랫폼을 개발 중에 있다.마이크로칩테크놀로지가 자회사인 실리콘 스토리지 테크놀로지(Silicon Storage Technology, SST)를 통해 SuperFlash® memBrain™ 뉴로모픽 메모리 솔루션 평
대규모 언어 모델(LLM)의 획기적인 새로운 기능은 인공지능(AI)의 영역을 넓히고 있다. 그러나 큰 크기와 특수한 실행 특성으로 비용 효율적인 방식으로 사용하기 어려울 수 있다.여기에, 엔비디아가 새로운 소프트웨어 '엔비디아 텐서RT-LLM(NVIDIA TensorRT-LLM)'의 출시를 지난 8일(현지시간) 발표했다.엔비디아는 대규모 언어 모델 추론을 가속화하고 최적화하기 위해 메타(Meta), 애니스케일(Anyscale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI
다양한 제품을 개발하고 그 기능을 개선하려는 임베디드 시스템 설계자들에게 머신러닝(Machine Learning, ML)은 갖춰야 할 필수 구현 사항으로 점차 인식되고 있다.마이크로컨트롤러, 혼합 신호, 아날로그 반도체 및 플래시-IP 솔루션 분야의 세계적 리더인 마이크로칩테크놀로지(Microchip Technology)는 이러한 요구에 부응하기 위해 간소화된 인공지능(AI) 모델을 개발할 수 있는 통합 워크플로우 MPLAB® 머신러닝 개발 스위트를 출시했다.이 소프트웨어 툴 키트는 마이크로칩의 마이크로 컨트롤러 유닛(Micro C
아랍에미리트(UAE) 글로벌 과학연구센터첨단기술연구위원회(Advanced Technology Research Council, 이하, ATRC)의 기술혁신연구소(Tech Innovation Institute. 이하, TII)가 대형언어모델(LLM) 이자 생성 AI(Generative AI) 글로벌 민주화에 혁신을 거듭하고 있다.UAE 최초, LLM 이자 생성 AI 모델 '팰컨 40B(Falcon 40B)'을 지난 5월 말 오픈소스로 공개한지 불과 몇 개월 만에 고급 버전인 '팰컨 180B(Falcon 180B)'를 6일(현지시간) 오