คูมือ Voice Changer + Obsidian Voice Memos

ใช้ voice changer กับการถอดความ Whisper เพื่อจับภาพเสียง memo โดยตรงเข้า Obsidian คำแนะนำฉบับสมบูรณ์สำหรับ knowledge worker บน Windows 10/11

Knowledge worker ที่ทำบันทึกใน Obsidian เข้าใจแล้วถึงมูลค่าของข้อความธรรมดา ที่เก็บในเครื่องเป็น second brain ของพวกเขา สิ่งที่หลายคนยังไม่ได้สำรวจคือการเพิ่มการประมวลผลเสียง real-time ด้านบนของการพูดเข้าคำ เปลี่ยนไมโครโฟนให้เป็นอุปกรณ์อินพุตที่รักษาความเป็นส่วนตัว บนพื้นฐานบุคลิกภาพที่ feeds โดยตรงเข้า vault PKM ของพวกเขา

คูมือนี้ครอบคลุมวัฒนาการการทำงานฉบับสมบูรณ์: การส่งไมโครโฟนของคุณผ่านการประมวลผลเสียง AI ของ VoxBooster, ส่งสัญญาณนั้นไปยัง plugin การถอดความที่ขับเคลื่อนด้วย Whisper ของ Obsidian และเชื่อมต่อเอาต์พุตกับ Daily Notes แผนภาพ Mermaid และเซสชันการตรวจสอบเสียง มันเป็นเป้าหมายสำหรับ knowledge worker บน Windows 10/11 ที่ใช้ Obsidian แล้วและต้องการวิธีการจับที่เร็วกว่า ส่วนตัวมากขึ้น

TL;DR

  • Mic ปลอม low-latency audio capture ของ VoxBooster เสียบตรงไปยัง plugin Speech to Text และ Audio Notes ของ Obsidian
  • การประมวลผลเสียง AI sub-300ms เก็บการพูดเข้าคำให้เป็นธรรมชาติ; ไม่มีความล่าช้าที่จดได้ระหว่างการพูดและการถอดความ
  • การถอดความ Whisper ในเครื่องหมายความว่าไม่มีลายนิ้วมือเสียงดิบที่ถูกส่งไปยังเซิร์ฟเวอร์ภายนอก
  • บุคลิกภาพเสียงให้คุณสามารถ narrate และตรวจสอบบันทึกใน “ความเสียงอ่าน” ที่แตกต่างจากเสียงการจับของคุณ
  • Obsidian ข้ามแพลตฟอร์ม; VoxBooster เพียง Windows 10/11 เท่านั้น บันทึกจะซิงค์ที่ใดก็ได้ การประมวลผลเสียงอยู่บน Windows
  • ไม่ต้องใช้ kernel driver; ไม่มีซอฟต์แวร์สายเคเบิลปลอม; ติดตั้งในเวลาน้อยกว่าสองนาที

Obsidian คืออะไร และทำไม Voice Input จึงสำคัญสำหรับ PKM

Obsidian เป็นแอปพลิเคชันการจัดการความรู้ที่อิงจาก Markdown ซึ่งสร้างขึ้นรอบ vault ในเครื่องของไฟล์ข้อความธรรมดา ต่างจากเครื่องมือบันทึกแบบ cloud-first ทุกบันทึกอยู่บนเครื่องของคุณเป็นไฟล์ .md ที่คุณเป็นเจ้าของ ชุมชน personal knowledge management ได้สร้างระบบนิเวศ plugin ที่หนาแน่นรอบมัน บันทึกประจำวัน graph views, templating และมากขึ้น voice capture

ความเป็นไปได้ของเสียง PKM ใจเร่งในลักษณะที่ต่างกัน เดินผ่านปัญหาออกเสียงดังจับลักษณะการให้เหตุผลที่พิมพ์ชุด keyboard ขัดขวาง ของคุณปมของคุณติดตั้ง ลำธารการวิเคราะห์ของคุณอยู่ไว้ บันทึกสนามกับต้องการ brain dump หลังการประชุมและสายอาบน้ำกลางคืนแล้วทั้งหมดออกมาพูดเร็วกว่าพิมพ์ แรงเสียดทานลดลงมีความเป็นจริงมากพอที่ผู้วิจัยและที่ปรึกษามักจับ 2000-3000 คำต่อชั่วโมงผ่านทางพูดเข้าคำเทียบกับ 600-800 คำต่อชั่วโมงพิมพ์

ชิ้นส่วนที่หายไปในการตั้งค่าส่วนใหญ่คือสิ่งที่เกิดขึ้นกับสัญญาณเสียงนั้นก่อนการถอดความ การจับเสียงไมโครโฟนดิบส่งลายนิ้วมือเสียงจริงของคุณไปยัง Whisper (หรือบริการถอดความคลาวด์) สำหรับ knowledge worker ที่มีความเป็นส่วนตัว นั่นคือการเปิดเผยที่มีความหมาย สำหรับใครก็ตามที่ใช้การตรวจสอบเสียง ปล่อยบันทึกในบุคลิกภาพ tenaga แต่เรื่องสม่ำเสมออย่างชัดเจน บันทึก microphone ที่ยังไม่ได้ประมวลผลยังคงยากที่จะแยกแยะจากเสียงรบกวนในสภาพแวดล้อมและยากขึ้นอย่างหลีกเลี่ยง

นั่นคือช่องว่างที่วัฒนาการการทำงานนี้เติมเต็มไว้

Two Key Obsidian Plugins

Speech to Text

Plugin Speech to Text (มีอยู่ในไดเรกทอรี่ plugin ชุมชน Obsidian) จับภาพเสียงจากอุปกรณ์อินพุตที่คุณเลือกและส่งไปยังจุดปลาย Whisper เพื่อการถอดความ ข้อความที่ได้นั้นจะถูกแทรกแบบ inline ที่ตำแหน่งเคอร์เซอร์ของคุณ ตัวเลือกการตั้งค่าประกอบด้วย:

  • การเลือกอุปกรณ์อินพุต เลือกอินพุตเสียงใด ๆ รวมถึง mic ปลอม low-latency audio capture
  • Whisper endpoint cloud (ต้องใช้ OpenAI API key) หรือ local (Whisper.cpp server, Faster-Whisper ฯลฯ)
  • ไฟล์เป้าหมาย แทรกที่เคอร์เซอร์หรือเพิ่มเข้าไปในพาธบันทึกประจำวันที่กำหนด
  • ตัวบ่งชี้ภาษา ช่วยความแม่นยำ Whisper สำหรับการพูดเข้าคำที่ไม่ใช่ภาษาอังกฤษหรือหลายภาษา

สำหรับการตั้งค่าที่รักษาความเป็นส่วนตัว ให้ชี้จุดปลายไปยัง instance Whisper ในเครื่อง Plugin Speech to Text รองรับจุดปลาย /v1/audio/transcriptions ที่เข้ากันได้กับ OpenAI ใด ๆ ดังนั้นเซิร์ฟเวอร์ Whisper ในเครื่องใด ๆ ที่เลียนแบบอินเทอร์เฟซนั้นใช้งานได้

Audio Notes

Plugin Audio Notes ใช้วิธีการที่แตกต่าง: บันทึก file เสียงดิบลงใน vault ของคุณพร้อมกับการถอดความ คุณสิ้นสุดด้วยบันทึก Markdown ที่มีทั้งการฝัง playback (![[recording-2026-06-10.m4a]]) และข้อความที่ถอดความด้านล่างนั้น นี่มีประโยชน์สำหรับ:

  • บันทึกอ้างอิงที่คุณต้องการตรวจสอบการถอดความในภายหลัง
  • บันทึกการประชุมที่สอดคล้องกับผู้พูดเฉพาะเจาะจง
  • เซสชั่นการทบทวนนำเรื่องบุคลิกภาพ บันทึกตัวเองอ่านบันทึกด้วยเสียงเงียบ ฝังเสียง ใช้ไฟล์ผ่าน Obsidian Publish

Audio Notes ยังรองรับการเลือกอุปกรณ์อินพุตได้ด้วย ดังนั้นมันจะจับ mic ปลอม low-latency audio capture จาก VoxBooster แบบเดียวกับที่ Speech to Text ทำ

Setting Up VoxBooster as Your Obsidian Microphone

VoxBooster เป็น Windows 10/11 voice changer และเครื่องมือ AI voice cloning ที่ประมวลผลไมโครโฟนของคุณแบบ real-time ผ่าน low-latency audio capture ไม่มี kernel driver ไม่มี virtual audio cable software การตั้งค่าวัฒนาการการทำงาน Obsidian จะใช้เวลาประมาณสองนาที

ขั้นตอนที่ 1 ติดตั้ง VoxBooster ดาวน์โหลดและติดตั้ง บน Windows 10/11 ไม่ต้องเริ่มต้นใหม่

ขั้นตอนที่ 2 เลือกเสียง ในแท็บ Voice เลือก preset หรือโหลดโปรไฟล์เสียง AI-cloned ที่กำหนดเอง สำหรับการพูดเข้าคำ preset “narrator tenang” ที่มีการลดลงของ pitch เบา ๆ และ reverb ขั้นต่ำจะใช้งานได้ดี มันแตกต่างจากเสียงธรรมชาติของคุณ (สำคัญสำหรับความเป็นส่วนตัว) แต่ยังคงฟังเป็นธรรมชาติสำหรับ Whisper (สำคัญสำหรับความแม่นยำของการถอดความ)

ขั้นตอนที่ 3 เปิดใช้งาน mic ปลอม ในการตั้งค่า Output ของ VoxBooster ยืนยันว่า mic ปลอม low-latency audio capture ทำงาน มันปรากฏในการตั้งค่าเสียง Windows เป็น “VoxBooster Virtual Mic”

ขั้นตอนที่ 4 ตั้งค่า plugin Obsidian ในการตั้งค่า plugin Speech to Text หรือ Audio Notes ตั้งค่าอุปกรณ์อินพุตให้เป็น “VoxBooster Virtual Mic” ทดสอบด้วยบันทึกสั้น ๆ เพื่อตรวจสอบว่า plugin จับสัญญาณที่เปลี่ยนแปลง

ขั้นตอนที่ 5 ตั้งค่า Whisper endpoint สำหรับการประมวลผลในเครื่อง: ติดตั้ง Whisper.cpp หรือ Faster-Whisper เริ่มเซิร์ฟเวอร์ที่ http://localhost:8080 และชี้ URL API ของ plugin ที่นั่น สำหรับ cloud: วางคีย์ API OpenAI ของคุณลงในการตั้งค่า plugin

นั่นคือ stack ฉบับสมบูรณ์: เสียงของคุณ, การประมวลผล AI VoxBooster, mic ปลอม low-latency audio capture, plugin Obsidian, Whisper, ข้อความ Markdown ใน vault ของคุณ

Privacy-Protected Voice Capture

ข้อโต้แย้งความเป็นส่วนตัวสำหรับการตั้งค่านี้มีสองชั้น

ชั้นแรก: ความสับสนของลายนิ้วมือเสียง การประมวลผลเสียง AI เปลี่ยนลักษณะเสียงของเสียงของคุณ pitch, timbre, cadence envelope พอที่เอาต์พุตไม่ตรงกับลายนิ้วมือเสียงชีวมิติของคุณ หากการถอดความของคุณไปยังจุดปลาย Whisper บนคลาวด์ เสียงที่อัปโหลดนั้นจะไม่สามารถระบุตัวตนได้ว่าเป็นของคุณ สิ่งนี้สำคัญสำหรับนักข่าว ทนาย นักบำบัด และใครก็ตามที่บันทึกเสียงอาจถูกยึดหรือกวาด

ชั้นที่สอง: การถอดความในเครื่อง การเรียกใช้ Whisper ในเครื่อง (Whisper.cpp, Faster-Whisper หรือ Ollama ที่มีโมเดลคำพูด) หมายความว่าเสียงไม่เคยออกจากเครื่องของคุณเลย เมื่อรวมกับการประมวลผลเสียง คุณจะได้รับการพูดเข้าคำที่ไม่ระบุตัวตนโดยอะคูสติกและได้รับการประมวลผลในเครื่อง สิ่งเดียวที่มีอยู่ภายนอกคือข้อความ Markdown ที่ได้ ซึ่งคุณควบคุม

นี่คือความแตกต่างอย่างมีนัยสำคัญจากการพูดเข้าคำไมโครโฟนดิบลงไปยังบริการถอดความบนคลาวด์ โดยที่ลายนิ้วมือเสียงและเนื้อหาบันทึกของคุณ ทั้งสองจำเป็นต้องได้รับการจัดเก็บบนเซิร์ฟเวอร์ภายนอก

Persona-Based Note Narration and Audio Review

เทคนิค PKM ที่ใช้ไม่เพียงพอเทพเจ้า - การตรวจสอบเสียง - ปล่อยบันทึกในเสียงการอ่าน tenaga ที่เน้นการอ่านใหม่อีกครั้งเพียง แนวคิดมาจากการวิจัยหน่วยความจำ: การฟังพึ่งพาเนื้อหาโดยสรุปในช่วงเวลาความสนใจต่ำ (เดิน สัญจร) เสริมสร้างการเก็บรักษาแตกต่างจากการอ่านใหม่ที่ใช้งาน

Voice changer เพิ่มการพับที่มีประโยชน์ที่นี่ บันทึกบันทึกของคุณโดยใช้ VoxBooster ของ AI voice cloning ที่มีบุคลิกภาพ “narrator” ส่วนเปลี่ยน pitch เบา ๆ และการตั้งค่าการประมวลผลช้ากว่าฟังเป็นพระเจ้า และเงียบ เมื่อคุณเล่นบันทึก Audio Notes คุณกำลังฟังเสียงที่แตกต่างกันที่สมองของคุณจัดหมวดหมู่ต่างจากการพูดจำเพาะของคุณ ด้วยเหตุนี้เองตามลักษณะ นี่ทำให้ง่ายขึ้นในการรับบันทึกของคุณเองเป็นข้อมูลแทนที่จะเป็นการวิจารณ์ตนเอง

วัฒนาการการทำงาน:

  1. ข้อมูลบันทึกโดยใช้เสียงบุคลิกภาพบุคลิกภาพนายกรัฐมนตรี
  2. Audio Notes จับบันทึกและถอดความทั้งคู่
  3. เล่น embed .m4a เมื่อตรวจสอบ เสียงผู้อ่านเรื่องมีน้ำหนักความหมาย
  4. ถอดความด้านล่างให้บันทึก Obsidian ที่สามารถค้นหาและเชื่อมโยงได้

นี่คือตัวเลือก workflow cog core ใช้งานกับเสียงใด ๆ แต่มันคือความแตกต่างสำหรับ knowledge worker ที่มีแนวปฏิบัติการตรวจสอบ Obsidian ที่หนัก

Daily Notes Integration

ฟีเจอร์ Daily Notes ของ Obsidian สร้างบันทึกใหม่สำหรับแต่ละวันโดยใช้แม่แบบที่ปรับแต่งได้ Plugin Speech to Text สามารถตั้งค่าให้เพิ่มการถอดความไปยังบันทึกประจำวันปัจจุบันโดยอัตโนมัติ การทำเครื่องหมายด้วยแสตมป์เวลาสำหรับแต่ละบล็อกการพูดเข้าคำ

ชิ้นแม่แบบที่มีประโยชน์สำหรับการจับเสียง:

## Voice Captures

<!-- Dictation blocks appended below by Speech to Text plugin -->

ด้วยเป้าหมายของ plugin ตั้งค่าเป็น Daily/{{date}}.md และเปิดใช้งานโหมด append แต่ละเซสชั่นการพูดเข้าคำเพิ่มบล็อกเหมือน:

### 14:23
Discussed the Q3 roadmap framing with the team. Key tension is between depth-first feature completion and breadth-first platform stability. Action item: draft a decision matrix comparing the two tracks by Friday.

เมื่อสิ้นวัน บันทึกประจำวันของคุณประกอบด้วยเส้นทางการตรวจสอบของแสตมป์เวลาของทุกความคิดในการพูดที่คุณจับ นี่รวมเข้ากับแบ็คลิงค์กราฟของ Obsidian ตามธรรมชาติ ชื่อที่เหมาะสม แท็กโครงการ หรือ [[linked note]] ที่คุณพูดเข้าคำกลายเป็นลิงก์สดในกราฟ

Mermaid Diagram Workflow

แผนภาพ Mermaid แสดงผลภายใน Obsidian เกิดขึ้นตามธรรมชาติ เสียง capture + การประมวลผล AI สร้างท่อน่าประหลาดใจที่มีประสิทธิภาพสำหรับการสร้างพวกเขา:

  1. พูดเข้าคำกระบวนการ “ผู้ใช้ส่งแบบฟอร์ม ซึ่งกระตุ้นการตรวจสอบอีเมล จากนั้นเมื่อการยืนยัน บัญชีจะถูกเปิดใช้งาน และส่งอีเมลต้อนรับ”
  2. รับ Whisper transcript ข้อความตรงจะลงจอดในบันทึกของคุณ
  3. Prompt language model วางข้อความ transcript และขอแผนภาพ flowchart Mermaid
  4. วางผลลัพธ์ ห่อในบล็อก “mermaid และ Obsidian จะแสดงผลโดยตรง

ขั้นตอน voice changer เป็นตัวเลือกสำหรับการสร้าง Mermaid โดยเฉพาะ แต่เก็บวัฒนาการการทำงานฉบับสมบูรณ์ที่มีความสม่ำเสมอ: คุณเป็นพูดเข้าคำเสมอในไมโครโฟน low-latency audio capture ปลอมเดียวกัน ถอดความตลอดเวลาผ่านจุดปลาย Whisper ในเครื่องเดียวกัน ไม่ว่าเอาต์พุตจะเป็นด้านข้าง bullet point หรือแผนภาพ

Comparison: Voice Capture Methods for Obsidian on Windows

วิธีความเป็นส่วนตัวการถอดความการตั้งค่าเสียงบุคลิกภาพทำงาน offline
Raw mic -> cloud Whisperต่ำดีเยี่ยมง่ายไม่ไม่
Raw mic -> local Whisperปานกลางดีปานกลางไม่ใช่
VoxBooster -> cloud Whisperปานกลาง-สูงดีเยี่ยมง่ายใช่ไม่
VoxBooster -> local Whisperสูงดีปานกลางใช่ใช่
Manual typingN/AN/Aไม่มีN/Aใช่

การรวม VoxBooster + Whisper ในเครื่องนั่งอยู่ที่มุมความเป็นส่วนตัวสูง offline-capable ของเมทริกซ์ การแลกเปลี่ยนความแม่นยำของการถอดความที่ความแม่นยำ Whisper cloud นั้นเป็นจริง แต่มีขนาดเล็ก โมเดล Whisper ขนาดกลางในเครื่องทำงานเทียบได้กับ cloud API สำหรับคำพูดที่สะอาดในสภาพแวดล้อมที่เงียบ และ noise suppression ของ VoxBooster ช่วยได้โดยการทำความสะอาดสัญญาณก่อนที่มันจะถึง Whisper

Soundboard Integration for PKM Sessions

ถือว่าเล็กน้อยแต่ควรอ้างอิง: soundboard ของ VoxBooster สามารถใช้ระหว่างเซสชั่น capture Obsidian เป็นสัญญาณ focus ก่อ clip เสียงสั้น ๆ (ding นุ่ม เสียง keyboard วงการ white noise เริ่มต้น) ไปยัง hotkey ที่คุณทริกเกอร์ก่อนเริ่มต้นบล็อกการพูดเข้าคำ สัญญาณ auditory สำเร็จการศึกษาสมองของคุณว่าไม่กี่วินาทีต่อมาเป็น “โหมด capture” การนำไปใช้ต่ำแนะนำของลักษณะการเปลี่ยนบริบทที่ผู้วิจัยผลผลิตแนะนำ

นี่ไม่ใช่ฟีเจอร์ของการรวม Obsidian นั่นเอง; มันเป็นเพียง output low-latency audio capture เล่นผ่านทำให้เสียงลำโพง หรือหูฟังของคุณแยกจากสัญญาณ mic นั้น เสียง soundboard ไม่ปรากฏในบันทึก Obsidian ของคุณ

Honest Limitations

วัฒนาการการทำงานนี้มีข้อจำกัดที่จริงสมควรชื่อให้ไป

Windows เท่านั้น VoxBooster ทำงานบน Windows 10/11 หากคุณสลับไปมาระหว่างเดสก์ท็อป Windows และ MacBook การประมวลผลเสียง จะใช้เฉพาะบนเครื่อง Windows Vault ของคุณจะซิงค์ที่ใดก็ได้ วัฒนาการการทำงานเสียงของคุณไม่

ความต้องการ hardware Whisper ในเครื่อง การเรียกใช้ Whisper ในเครื่องจำเป็นต้องใช้ทรัพยากร CPU หรือ GPU ที่มีความหมาย โมเดลปานกลางต้องใช้ RAM 3-4 GB และส่งผลให้ความล่าช้าการถอดความที่จดเห็นได้บนฮาร์ดแวร์เก่า โมเดลเล็ก ๆ ที่เร็วกว่า แต่ความแม่นยำลดลงในเสียงที่มีสำเนียงหรือคำศัพท์เฉพาะทาง Whisper cloud หลีกเลี่ยงนี้ที่ค่าใช้จ่ายของความเป็นส่วนตัว

ความแม่นยำในการถอดความสำหรับคำศัพท์ที่ผิดปกติ บันทึก PKM มักประกอบด้วย codename project คำศัพท์ทางเทคนิค และชื่อที่เหมาะสม Whisper จัดการส่วนใหญ่ของสิ่งนี้ได้ดี แต่ทำให้เกิดข้อผิดพลาดที่เป็นระบบบนคำศัพท์เฉพาะ (มันเรื่อยตลอดอย่างหมดแบบชื่อซอฟต์แวร์บางชื่อที่ผิด) Plugin Speech to Text รองรับตัวบ่งชี้คำศัพท์ที่กำหนดเองในเวอร์ชัน Whisper ที่ใหม่กว่า ควรกำหนดค่าหากบันทึกของคุณประกอบด้วยคำศัพท์ที่ผิดปกติที่เกิดซ้ำ

ไม่มีส่วนเสริมมือถือ Obsidian บน iOS และ Android ชัดเจนไม่สามารถใช้ VoxBooster ซึ่งเป็นซอฟต์แวร์เดสก์ท็อป Windows วัฒนาการการทำงาน mobile มีความแยกต่างหาก ใช้ไมโครโฟน native ยอมรับว่าการประมวลผลเสียงไม่ใช้และพึ่งพา vault sync เพื่อนำบันทึกนั้นไปยังเครื่อง Windows ของคุณ

Getting Started

ธรรมชาติทางเร็วที่สุดไปยังการตั้งค่าการทำงาน:

  1. ดาวน์โหลด VoxBooster และเสร็จสิ้นห้านาที installation
  2. ติดตั้ง plugin Speech to Text จากไดเรกทอรี่ plugin ชุมชน Obsidian
  3. ตั้งค่าอินพุต plugin ให้เป็น VoxBooster Virtual Mic และ endpoint ไปยังเซิร์ฟเวอร์ Whisper ของคุณ (หรือ API cloud)
  4. สร้างบันทึกประจำวันทดสอบและพูดเข้าคำย่อหน้า ยืนยันว่า transcript ปรากฏ
  5. สำรวจ pricing แผนเริ่มจาก R$29,90/เดือน; แผนทั้งหมดรวม AI voice cloning และ mic ปลอม low-latency audio capture

สำหรับชุดฟีเจอร์ฉบับสมบูรณ์รวมถึงโปรไฟล์ AI voice cloning และการจัดการ preset หน้าฟีเจอร์ VoxBooster ครอบคลุมตัวเลือกโดยละเอียด

สำหรับการอ่านเกี่ยวข้องกับวัฒนาการการทำงานเสียง penyelaman salam ghi âm Whisper ครอบคลุมการตั้งค่า endpoint ในเครื่องโดยละเอียดมากขึ้น และ hướng dẫn voice changer cho Discord ครอบคลุมไมโครโฟน low-latency audio capture ปลอมเดียวกันในบริบทการสื่อสารแบบ real-time

FAQ

Voice changer Obsidian คืออะไรและทำไมฉันถึงควรใช้มัน Voice changer Obsidian จะส่งไมโครโฟนของคุณผ่านการประมวลผลเสียง AI แบบ real-time ก่อนที่ plugin Speech to Text ของ Obsidian จะจับมัน นี่เป็นการรักษาความเป็นส่วนตัวระหว่างการพูดเข้าคำ การเพิ่มการอ่านพูดตามบุคลิกภาพสำหรับการตรวจสอบเสียง และการเก็บเสียงจริงของคุณให้พ้นจากบริการถอดความบนคลาวด์

Plugin Obsidian ใดที่ดีที่สุดสำหรับการจับเสียง memo Plugin ที่เชื่อถือได้มากที่สุดสองแบบคือ Speech to Text (ส่งเสียงไป Whisper สำหรับการถอดความแบบ inline) และ Audio Notes (บันทึกและฝัง file เสียงพร้อมกับบัญชีถอดความข้างเคียง) ทั้งคู่ใช้งานกับอุปกรณ์อินพุตเสียงใด ๆ รวมถึง mic ปลอม low-latency audio capture จาก VoxBooster

VoxBooster ทำงานกับ Obsidian บน Windows ได้หรือไม่ ใช่ VoxBooster เปิดเผย low-latency audio capture virtual microphone ที่สามารถเลือกได้โดยตรงโดย plugin อินพุตเสียง Obsidian ของคุณ ความล่าช้า sub-300ms หมายความว่าเสียงที่เปลี่ยนรูปมาถึง Whisper อย่างสะอาดและไม่มีความล่าช้าที่จดได้ระหว่างการพูดเข้าคำ

ฉันสามารถใช้การตั้งค่านี้สำหรับการบันทึกเสียงที่ละเอียดอ่อนต่อความเป็นส่วนตัวได้หรือไม่ คุณสามารถลดการเปิดเผยได้อย่างมีนัยสำคัญโดยการเรียกใช้ Whisper ในเครื่อง เมื่อรวมกับการประมวลผลเสียงที่เปลี่ยนลักษณะเสียงของคุณ การถอดความในเครื่องหมายความว่าไม่มีลายนิ้วมือเสียงดิบที่ออกจากเครื่องของคุณ

Obsidian ทำงานบน Windows ได้หรือไม่ Obsidian ทำงานข้ามแพลตฟอร์มและทำงานบน Windows, macOS, Linux, iOS และ Android VoxBooster อย่างไรก็ตาม เพียง Windows 10/11 เท่านั้น ส่วน voice changer และการถอดความ Whisper ของวัฒนาการการทำงานนี้ใช้ได้เฉพาะใน Windows เท่านั้น บันทึก Markdown ที่ได้นั้นจะมีการซิงค์ที่ใดก็ได้ผ่าน Obsidian Sync หรือโฟลเดอร์คลาวด์ใด ๆ

ฉันจะรวมเสียง memo กับ Obsidian Daily Notes ได้อย่างไร Plugin Speech to Text สามารถตั้งค่าให้เพิ่มข้อความที่ถอดความลงในแม่แบบบันทึกประจำวันโดยอัตโนมัติ ตั้งค่าไฟล์เป้าหมายให้ชี้ไปที่พาธ Daily Notes ของคุณและแต่ละเซสชันพูดเข้าคำจะเพิ่มบล็อกที่มีแสตมป์เวลาลงในบันทึกของวันนั้น

ฉันสามารถสร้างแผนภาพ Mermaid จากเสียง memo ใน Obsidian ได้หรือไม่ ไม่ใช่โดยอัตโนมัติ แต่วัฒนาการการทำงานเข้ากับมันได้ดี พูดเข้าคำคำอธิบายด้วยวาจาของกระบวนการ รับ Whisper transcript จากนั้นวางข้อความลงในข้อความ language model ที่ส่งออกแผนภาพ Mermaid คัดลอกผลลัพธ์ลงในบล็อกโค้ด mermaid ที่ล้อมรอบและ Obsidian จะแสดงผลโดยตรง

ลอง VoxBooster — ทดลองใช้ฟรี 3 วัน

โคลนเสียงเรียลไทม์ ซาวด์บอร์ด และเอฟเฟกต์ — ทุกที่ที่คุณคุย

  • ไม่ต้องใช้บัตรเครดิต
  • ความหน่วง ~30ms
  • Discord · Teams · OBS
ลองฟรี 3 วัน