Knowledge worker ที่ทำบันทึกใน Obsidian เข้าใจแล้วถึงมูลค่าของข้อความธรรมดา ที่เก็บในเครื่องเป็น second brain ของพวกเขา สิ่งที่หลายคนยังไม่ได้สำรวจคือการเพิ่มการประมวลผลเสียง real-time ด้านบนของการพูดเข้าคำ เปลี่ยนไมโครโฟนให้เป็นอุปกรณ์อินพุตที่รักษาความเป็นส่วนตัว บนพื้นฐานบุคลิกภาพที่ feeds โดยตรงเข้า vault PKM ของพวกเขา
คูมือนี้ครอบคลุมวัฒนาการการทำงานฉบับสมบูรณ์: การส่งไมโครโฟนของคุณผ่านการประมวลผลเสียง AI ของ VoxBooster, ส่งสัญญาณนั้นไปยัง plugin การถอดความที่ขับเคลื่อนด้วย Whisper ของ Obsidian และเชื่อมต่อเอาต์พุตกับ Daily Notes แผนภาพ Mermaid และเซสชันการตรวจสอบเสียง มันเป็นเป้าหมายสำหรับ knowledge worker บน Windows 10/11 ที่ใช้ Obsidian แล้วและต้องการวิธีการจับที่เร็วกว่า ส่วนตัวมากขึ้น
TL;DR
- Mic ปลอม low-latency audio capture ของ VoxBooster เสียบตรงไปยัง plugin Speech to Text และ Audio Notes ของ Obsidian
- การประมวลผลเสียง AI sub-300ms เก็บการพูดเข้าคำให้เป็นธรรมชาติ; ไม่มีความล่าช้าที่จดได้ระหว่างการพูดและการถอดความ
- การถอดความ Whisper ในเครื่องหมายความว่าไม่มีลายนิ้วมือเสียงดิบที่ถูกส่งไปยังเซิร์ฟเวอร์ภายนอก
- บุคลิกภาพเสียงให้คุณสามารถ narrate และตรวจสอบบันทึกใน “ความเสียงอ่าน” ที่แตกต่างจากเสียงการจับของคุณ
- Obsidian ข้ามแพลตฟอร์ม; VoxBooster เพียง Windows 10/11 เท่านั้น บันทึกจะซิงค์ที่ใดก็ได้ การประมวลผลเสียงอยู่บน Windows
- ไม่ต้องใช้ kernel driver; ไม่มีซอฟต์แวร์สายเคเบิลปลอม; ติดตั้งในเวลาน้อยกว่าสองนาที
Obsidian คืออะไร และทำไม Voice Input จึงสำคัญสำหรับ PKM
Obsidian เป็นแอปพลิเคชันการจัดการความรู้ที่อิงจาก Markdown ซึ่งสร้างขึ้นรอบ vault ในเครื่องของไฟล์ข้อความธรรมดา ต่างจากเครื่องมือบันทึกแบบ cloud-first ทุกบันทึกอยู่บนเครื่องของคุณเป็นไฟล์ .md ที่คุณเป็นเจ้าของ ชุมชน personal knowledge management ได้สร้างระบบนิเวศ plugin ที่หนาแน่นรอบมัน บันทึกประจำวัน graph views, templating และมากขึ้น voice capture
ความเป็นไปได้ของเสียง PKM ใจเร่งในลักษณะที่ต่างกัน เดินผ่านปัญหาออกเสียงดังจับลักษณะการให้เหตุผลที่พิมพ์ชุด keyboard ขัดขวาง ของคุณปมของคุณติดตั้ง ลำธารการวิเคราะห์ของคุณอยู่ไว้ บันทึกสนามกับต้องการ brain dump หลังการประชุมและสายอาบน้ำกลางคืนแล้วทั้งหมดออกมาพูดเร็วกว่าพิมพ์ แรงเสียดทานลดลงมีความเป็นจริงมากพอที่ผู้วิจัยและที่ปรึกษามักจับ 2000-3000 คำต่อชั่วโมงผ่านทางพูดเข้าคำเทียบกับ 600-800 คำต่อชั่วโมงพิมพ์
ชิ้นส่วนที่หายไปในการตั้งค่าส่วนใหญ่คือสิ่งที่เกิดขึ้นกับสัญญาณเสียงนั้นก่อนการถอดความ การจับเสียงไมโครโฟนดิบส่งลายนิ้วมือเสียงจริงของคุณไปยัง Whisper (หรือบริการถอดความคลาวด์) สำหรับ knowledge worker ที่มีความเป็นส่วนตัว นั่นคือการเปิดเผยที่มีความหมาย สำหรับใครก็ตามที่ใช้การตรวจสอบเสียง ปล่อยบันทึกในบุคลิกภาพ tenaga แต่เรื่องสม่ำเสมออย่างชัดเจน บันทึก microphone ที่ยังไม่ได้ประมวลผลยังคงยากที่จะแยกแยะจากเสียงรบกวนในสภาพแวดล้อมและยากขึ้นอย่างหลีกเลี่ยง
นั่นคือช่องว่างที่วัฒนาการการทำงานนี้เติมเต็มไว้
Two Key Obsidian Plugins
Speech to Text
Plugin Speech to Text (มีอยู่ในไดเรกทอรี่ plugin ชุมชน Obsidian) จับภาพเสียงจากอุปกรณ์อินพุตที่คุณเลือกและส่งไปยังจุดปลาย Whisper เพื่อการถอดความ ข้อความที่ได้นั้นจะถูกแทรกแบบ inline ที่ตำแหน่งเคอร์เซอร์ของคุณ ตัวเลือกการตั้งค่าประกอบด้วย:
- การเลือกอุปกรณ์อินพุต เลือกอินพุตเสียงใด ๆ รวมถึง mic ปลอม low-latency audio capture
- Whisper endpoint cloud (ต้องใช้ OpenAI API key) หรือ local (Whisper.cpp server, Faster-Whisper ฯลฯ)
- ไฟล์เป้าหมาย แทรกที่เคอร์เซอร์หรือเพิ่มเข้าไปในพาธบันทึกประจำวันที่กำหนด
- ตัวบ่งชี้ภาษา ช่วยความแม่นยำ Whisper สำหรับการพูดเข้าคำที่ไม่ใช่ภาษาอังกฤษหรือหลายภาษา
สำหรับการตั้งค่าที่รักษาความเป็นส่วนตัว ให้ชี้จุดปลายไปยัง instance Whisper ในเครื่อง Plugin Speech to Text รองรับจุดปลาย /v1/audio/transcriptions ที่เข้ากันได้กับ OpenAI ใด ๆ ดังนั้นเซิร์ฟเวอร์ Whisper ในเครื่องใด ๆ ที่เลียนแบบอินเทอร์เฟซนั้นใช้งานได้
Audio Notes
Plugin Audio Notes ใช้วิธีการที่แตกต่าง: บันทึก file เสียงดิบลงใน vault ของคุณพร้อมกับการถอดความ คุณสิ้นสุดด้วยบันทึก Markdown ที่มีทั้งการฝัง playback (![[recording-2026-06-10.m4a]]) และข้อความที่ถอดความด้านล่างนั้น นี่มีประโยชน์สำหรับ:
- บันทึกอ้างอิงที่คุณต้องการตรวจสอบการถอดความในภายหลัง
- บันทึกการประชุมที่สอดคล้องกับผู้พูดเฉพาะเจาะจง
- เซสชั่นการทบทวนนำเรื่องบุคลิกภาพ บันทึกตัวเองอ่านบันทึกด้วยเสียงเงียบ ฝังเสียง ใช้ไฟล์ผ่าน Obsidian Publish
Audio Notes ยังรองรับการเลือกอุปกรณ์อินพุตได้ด้วย ดังนั้นมันจะจับ mic ปลอม low-latency audio capture จาก VoxBooster แบบเดียวกับที่ Speech to Text ทำ
Setting Up VoxBooster as Your Obsidian Microphone
VoxBooster เป็น Windows 10/11 voice changer และเครื่องมือ AI voice cloning ที่ประมวลผลไมโครโฟนของคุณแบบ real-time ผ่าน low-latency audio capture ไม่มี kernel driver ไม่มี virtual audio cable software การตั้งค่าวัฒนาการการทำงาน Obsidian จะใช้เวลาประมาณสองนาที
ขั้นตอนที่ 1 ติดตั้ง VoxBooster ดาวน์โหลดและติดตั้ง บน Windows 10/11 ไม่ต้องเริ่มต้นใหม่
ขั้นตอนที่ 2 เลือกเสียง ในแท็บ Voice เลือก preset หรือโหลดโปรไฟล์เสียง AI-cloned ที่กำหนดเอง สำหรับการพูดเข้าคำ preset “narrator tenang” ที่มีการลดลงของ pitch เบา ๆ และ reverb ขั้นต่ำจะใช้งานได้ดี มันแตกต่างจากเสียงธรรมชาติของคุณ (สำคัญสำหรับความเป็นส่วนตัว) แต่ยังคงฟังเป็นธรรมชาติสำหรับ Whisper (สำคัญสำหรับความแม่นยำของการถอดความ)
ขั้นตอนที่ 3 เปิดใช้งาน mic ปลอม ในการตั้งค่า Output ของ VoxBooster ยืนยันว่า mic ปลอม low-latency audio capture ทำงาน มันปรากฏในการตั้งค่าเสียง Windows เป็น “VoxBooster Virtual Mic”
ขั้นตอนที่ 4 ตั้งค่า plugin Obsidian ในการตั้งค่า plugin Speech to Text หรือ Audio Notes ตั้งค่าอุปกรณ์อินพุตให้เป็น “VoxBooster Virtual Mic” ทดสอบด้วยบันทึกสั้น ๆ เพื่อตรวจสอบว่า plugin จับสัญญาณที่เปลี่ยนแปลง
ขั้นตอนที่ 5 ตั้งค่า Whisper endpoint สำหรับการประมวลผลในเครื่อง: ติดตั้ง Whisper.cpp หรือ Faster-Whisper เริ่มเซิร์ฟเวอร์ที่ http://localhost:8080 และชี้ URL API ของ plugin ที่นั่น สำหรับ cloud: วางคีย์ API OpenAI ของคุณลงในการตั้งค่า plugin
นั่นคือ stack ฉบับสมบูรณ์: เสียงของคุณ, การประมวลผล AI VoxBooster, mic ปลอม low-latency audio capture, plugin Obsidian, Whisper, ข้อความ Markdown ใน vault ของคุณ
Privacy-Protected Voice Capture
ข้อโต้แย้งความเป็นส่วนตัวสำหรับการตั้งค่านี้มีสองชั้น
ชั้นแรก: ความสับสนของลายนิ้วมือเสียง การประมวลผลเสียง AI เปลี่ยนลักษณะเสียงของเสียงของคุณ pitch, timbre, cadence envelope พอที่เอาต์พุตไม่ตรงกับลายนิ้วมือเสียงชีวมิติของคุณ หากการถอดความของคุณไปยังจุดปลาย Whisper บนคลาวด์ เสียงที่อัปโหลดนั้นจะไม่สามารถระบุตัวตนได้ว่าเป็นของคุณ สิ่งนี้สำคัญสำหรับนักข่าว ทนาย นักบำบัด และใครก็ตามที่บันทึกเสียงอาจถูกยึดหรือกวาด
ชั้นที่สอง: การถอดความในเครื่อง การเรียกใช้ Whisper ในเครื่อง (Whisper.cpp, Faster-Whisper หรือ Ollama ที่มีโมเดลคำพูด) หมายความว่าเสียงไม่เคยออกจากเครื่องของคุณเลย เมื่อรวมกับการประมวลผลเสียง คุณจะได้รับการพูดเข้าคำที่ไม่ระบุตัวตนโดยอะคูสติกและได้รับการประมวลผลในเครื่อง สิ่งเดียวที่มีอยู่ภายนอกคือข้อความ Markdown ที่ได้ ซึ่งคุณควบคุม
นี่คือความแตกต่างอย่างมีนัยสำคัญจากการพูดเข้าคำไมโครโฟนดิบลงไปยังบริการถอดความบนคลาวด์ โดยที่ลายนิ้วมือเสียงและเนื้อหาบันทึกของคุณ ทั้งสองจำเป็นต้องได้รับการจัดเก็บบนเซิร์ฟเวอร์ภายนอก
Persona-Based Note Narration and Audio Review
เทคนิค PKM ที่ใช้ไม่เพียงพอเทพเจ้า - การตรวจสอบเสียง - ปล่อยบันทึกในเสียงการอ่าน tenaga ที่เน้นการอ่านใหม่อีกครั้งเพียง แนวคิดมาจากการวิจัยหน่วยความจำ: การฟังพึ่งพาเนื้อหาโดยสรุปในช่วงเวลาความสนใจต่ำ (เดิน สัญจร) เสริมสร้างการเก็บรักษาแตกต่างจากการอ่านใหม่ที่ใช้งาน
Voice changer เพิ่มการพับที่มีประโยชน์ที่นี่ บันทึกบันทึกของคุณโดยใช้ VoxBooster ของ AI voice cloning ที่มีบุคลิกภาพ “narrator” ส่วนเปลี่ยน pitch เบา ๆ และการตั้งค่าการประมวลผลช้ากว่าฟังเป็นพระเจ้า และเงียบ เมื่อคุณเล่นบันทึก Audio Notes คุณกำลังฟังเสียงที่แตกต่างกันที่สมองของคุณจัดหมวดหมู่ต่างจากการพูดจำเพาะของคุณ ด้วยเหตุนี้เองตามลักษณะ นี่ทำให้ง่ายขึ้นในการรับบันทึกของคุณเองเป็นข้อมูลแทนที่จะเป็นการวิจารณ์ตนเอง
วัฒนาการการทำงาน:
- ข้อมูลบันทึกโดยใช้เสียงบุคลิกภาพบุคลิกภาพนายกรัฐมนตรี
- Audio Notes จับบันทึกและถอดความทั้งคู่
- เล่น embed
.m4aเมื่อตรวจสอบ เสียงผู้อ่านเรื่องมีน้ำหนักความหมาย - ถอดความด้านล่างให้บันทึก Obsidian ที่สามารถค้นหาและเชื่อมโยงได้
นี่คือตัวเลือก workflow cog core ใช้งานกับเสียงใด ๆ แต่มันคือความแตกต่างสำหรับ knowledge worker ที่มีแนวปฏิบัติการตรวจสอบ Obsidian ที่หนัก
Daily Notes Integration
ฟีเจอร์ Daily Notes ของ Obsidian สร้างบันทึกใหม่สำหรับแต่ละวันโดยใช้แม่แบบที่ปรับแต่งได้ Plugin Speech to Text สามารถตั้งค่าให้เพิ่มการถอดความไปยังบันทึกประจำวันปัจจุบันโดยอัตโนมัติ การทำเครื่องหมายด้วยแสตมป์เวลาสำหรับแต่ละบล็อกการพูดเข้าคำ
ชิ้นแม่แบบที่มีประโยชน์สำหรับการจับเสียง:
## Voice Captures
<!-- Dictation blocks appended below by Speech to Text plugin -->
ด้วยเป้าหมายของ plugin ตั้งค่าเป็น Daily/{{date}}.md และเปิดใช้งานโหมด append แต่ละเซสชั่นการพูดเข้าคำเพิ่มบล็อกเหมือน:
### 14:23
Discussed the Q3 roadmap framing with the team. Key tension is between depth-first feature completion and breadth-first platform stability. Action item: draft a decision matrix comparing the two tracks by Friday.
เมื่อสิ้นวัน บันทึกประจำวันของคุณประกอบด้วยเส้นทางการตรวจสอบของแสตมป์เวลาของทุกความคิดในการพูดที่คุณจับ นี่รวมเข้ากับแบ็คลิงค์กราฟของ Obsidian ตามธรรมชาติ ชื่อที่เหมาะสม แท็กโครงการ หรือ [[linked note]] ที่คุณพูดเข้าคำกลายเป็นลิงก์สดในกราฟ
Mermaid Diagram Workflow
แผนภาพ Mermaid แสดงผลภายใน Obsidian เกิดขึ้นตามธรรมชาติ เสียง capture + การประมวลผล AI สร้างท่อน่าประหลาดใจที่มีประสิทธิภาพสำหรับการสร้างพวกเขา:
- พูดเข้าคำกระบวนการ “ผู้ใช้ส่งแบบฟอร์ม ซึ่งกระตุ้นการตรวจสอบอีเมล จากนั้นเมื่อการยืนยัน บัญชีจะถูกเปิดใช้งาน และส่งอีเมลต้อนรับ”
- รับ Whisper transcript ข้อความตรงจะลงจอดในบันทึกของคุณ
- Prompt language model วางข้อความ transcript และขอแผนภาพ flowchart Mermaid
- วางผลลัพธ์ ห่อในบล็อก “mermaid และ Obsidian จะแสดงผลโดยตรง
ขั้นตอน voice changer เป็นตัวเลือกสำหรับการสร้าง Mermaid โดยเฉพาะ แต่เก็บวัฒนาการการทำงานฉบับสมบูรณ์ที่มีความสม่ำเสมอ: คุณเป็นพูดเข้าคำเสมอในไมโครโฟน low-latency audio capture ปลอมเดียวกัน ถอดความตลอดเวลาผ่านจุดปลาย Whisper ในเครื่องเดียวกัน ไม่ว่าเอาต์พุตจะเป็นด้านข้าง bullet point หรือแผนภาพ
Comparison: Voice Capture Methods for Obsidian on Windows
| วิธี | ความเป็นส่วนตัว | การถอดความ | การตั้งค่า | เสียงบุคลิกภาพ | ทำงาน offline |
|---|---|---|---|---|---|
| Raw mic -> cloud Whisper | ต่ำ | ดีเยี่ยม | ง่าย | ไม่ | ไม่ |
| Raw mic -> local Whisper | ปานกลาง | ดี | ปานกลาง | ไม่ | ใช่ |
| VoxBooster -> cloud Whisper | ปานกลาง-สูง | ดีเยี่ยม | ง่าย | ใช่ | ไม่ |
| VoxBooster -> local Whisper | สูง | ดี | ปานกลาง | ใช่ | ใช่ |
| Manual typing | N/A | N/A | ไม่มี | N/A | ใช่ |
การรวม VoxBooster + Whisper ในเครื่องนั่งอยู่ที่มุมความเป็นส่วนตัวสูง offline-capable ของเมทริกซ์ การแลกเปลี่ยนความแม่นยำของการถอดความที่ความแม่นยำ Whisper cloud นั้นเป็นจริง แต่มีขนาดเล็ก โมเดล Whisper ขนาดกลางในเครื่องทำงานเทียบได้กับ cloud API สำหรับคำพูดที่สะอาดในสภาพแวดล้อมที่เงียบ และ noise suppression ของ VoxBooster ช่วยได้โดยการทำความสะอาดสัญญาณก่อนที่มันจะถึง Whisper
Soundboard Integration for PKM Sessions
ถือว่าเล็กน้อยแต่ควรอ้างอิง: soundboard ของ VoxBooster สามารถใช้ระหว่างเซสชั่น capture Obsidian เป็นสัญญาณ focus ก่อ clip เสียงสั้น ๆ (ding นุ่ม เสียง keyboard วงการ white noise เริ่มต้น) ไปยัง hotkey ที่คุณทริกเกอร์ก่อนเริ่มต้นบล็อกการพูดเข้าคำ สัญญาณ auditory สำเร็จการศึกษาสมองของคุณว่าไม่กี่วินาทีต่อมาเป็น “โหมด capture” การนำไปใช้ต่ำแนะนำของลักษณะการเปลี่ยนบริบทที่ผู้วิจัยผลผลิตแนะนำ
นี่ไม่ใช่ฟีเจอร์ของการรวม Obsidian นั่นเอง; มันเป็นเพียง output low-latency audio capture เล่นผ่านทำให้เสียงลำโพง หรือหูฟังของคุณแยกจากสัญญาณ mic นั้น เสียง soundboard ไม่ปรากฏในบันทึก Obsidian ของคุณ
Honest Limitations
วัฒนาการการทำงานนี้มีข้อจำกัดที่จริงสมควรชื่อให้ไป
Windows เท่านั้น VoxBooster ทำงานบน Windows 10/11 หากคุณสลับไปมาระหว่างเดสก์ท็อป Windows และ MacBook การประมวลผลเสียง จะใช้เฉพาะบนเครื่อง Windows Vault ของคุณจะซิงค์ที่ใดก็ได้ วัฒนาการการทำงานเสียงของคุณไม่
ความต้องการ hardware Whisper ในเครื่อง การเรียกใช้ Whisper ในเครื่องจำเป็นต้องใช้ทรัพยากร CPU หรือ GPU ที่มีความหมาย โมเดลปานกลางต้องใช้ RAM 3-4 GB และส่งผลให้ความล่าช้าการถอดความที่จดเห็นได้บนฮาร์ดแวร์เก่า โมเดลเล็ก ๆ ที่เร็วกว่า แต่ความแม่นยำลดลงในเสียงที่มีสำเนียงหรือคำศัพท์เฉพาะทาง Whisper cloud หลีกเลี่ยงนี้ที่ค่าใช้จ่ายของความเป็นส่วนตัว
ความแม่นยำในการถอดความสำหรับคำศัพท์ที่ผิดปกติ บันทึก PKM มักประกอบด้วย codename project คำศัพท์ทางเทคนิค และชื่อที่เหมาะสม Whisper จัดการส่วนใหญ่ของสิ่งนี้ได้ดี แต่ทำให้เกิดข้อผิดพลาดที่เป็นระบบบนคำศัพท์เฉพาะ (มันเรื่อยตลอดอย่างหมดแบบชื่อซอฟต์แวร์บางชื่อที่ผิด) Plugin Speech to Text รองรับตัวบ่งชี้คำศัพท์ที่กำหนดเองในเวอร์ชัน Whisper ที่ใหม่กว่า ควรกำหนดค่าหากบันทึกของคุณประกอบด้วยคำศัพท์ที่ผิดปกติที่เกิดซ้ำ
ไม่มีส่วนเสริมมือถือ Obsidian บน iOS และ Android ชัดเจนไม่สามารถใช้ VoxBooster ซึ่งเป็นซอฟต์แวร์เดสก์ท็อป Windows วัฒนาการการทำงาน mobile มีความแยกต่างหาก ใช้ไมโครโฟน native ยอมรับว่าการประมวลผลเสียงไม่ใช้และพึ่งพา vault sync เพื่อนำบันทึกนั้นไปยังเครื่อง Windows ของคุณ
Getting Started
ธรรมชาติทางเร็วที่สุดไปยังการตั้งค่าการทำงาน:
- ดาวน์โหลด VoxBooster และเสร็จสิ้นห้านาที installation
- ติดตั้ง plugin Speech to Text จากไดเรกทอรี่ plugin ชุมชน Obsidian
- ตั้งค่าอินพุต plugin ให้เป็น VoxBooster Virtual Mic และ endpoint ไปยังเซิร์ฟเวอร์ Whisper ของคุณ (หรือ API cloud)
- สร้างบันทึกประจำวันทดสอบและพูดเข้าคำย่อหน้า ยืนยันว่า transcript ปรากฏ
- สำรวจ pricing แผนเริ่มจาก R$29,90/เดือน; แผนทั้งหมดรวม AI voice cloning และ mic ปลอม low-latency audio capture
สำหรับชุดฟีเจอร์ฉบับสมบูรณ์รวมถึงโปรไฟล์ AI voice cloning และการจัดการ preset หน้าฟีเจอร์ VoxBooster ครอบคลุมตัวเลือกโดยละเอียด
สำหรับการอ่านเกี่ยวข้องกับวัฒนาการการทำงานเสียง penyelaman salam ghi âm Whisper ครอบคลุมการตั้งค่า endpoint ในเครื่องโดยละเอียดมากขึ้น และ hướng dẫn voice changer cho Discord ครอบคลุมไมโครโฟน low-latency audio capture ปลอมเดียวกันในบริบทการสื่อสารแบบ real-time
FAQ
Voice changer Obsidian คืออะไรและทำไมฉันถึงควรใช้มัน Voice changer Obsidian จะส่งไมโครโฟนของคุณผ่านการประมวลผลเสียง AI แบบ real-time ก่อนที่ plugin Speech to Text ของ Obsidian จะจับมัน นี่เป็นการรักษาความเป็นส่วนตัวระหว่างการพูดเข้าคำ การเพิ่มการอ่านพูดตามบุคลิกภาพสำหรับการตรวจสอบเสียง และการเก็บเสียงจริงของคุณให้พ้นจากบริการถอดความบนคลาวด์
Plugin Obsidian ใดที่ดีที่สุดสำหรับการจับเสียง memo Plugin ที่เชื่อถือได้มากที่สุดสองแบบคือ Speech to Text (ส่งเสียงไป Whisper สำหรับการถอดความแบบ inline) และ Audio Notes (บันทึกและฝัง file เสียงพร้อมกับบัญชีถอดความข้างเคียง) ทั้งคู่ใช้งานกับอุปกรณ์อินพุตเสียงใด ๆ รวมถึง mic ปลอม low-latency audio capture จาก VoxBooster
VoxBooster ทำงานกับ Obsidian บน Windows ได้หรือไม่ ใช่ VoxBooster เปิดเผย low-latency audio capture virtual microphone ที่สามารถเลือกได้โดยตรงโดย plugin อินพุตเสียง Obsidian ของคุณ ความล่าช้า sub-300ms หมายความว่าเสียงที่เปลี่ยนรูปมาถึง Whisper อย่างสะอาดและไม่มีความล่าช้าที่จดได้ระหว่างการพูดเข้าคำ
ฉันสามารถใช้การตั้งค่านี้สำหรับการบันทึกเสียงที่ละเอียดอ่อนต่อความเป็นส่วนตัวได้หรือไม่ คุณสามารถลดการเปิดเผยได้อย่างมีนัยสำคัญโดยการเรียกใช้ Whisper ในเครื่อง เมื่อรวมกับการประมวลผลเสียงที่เปลี่ยนลักษณะเสียงของคุณ การถอดความในเครื่องหมายความว่าไม่มีลายนิ้วมือเสียงดิบที่ออกจากเครื่องของคุณ
Obsidian ทำงานบน Windows ได้หรือไม่ Obsidian ทำงานข้ามแพลตฟอร์มและทำงานบน Windows, macOS, Linux, iOS และ Android VoxBooster อย่างไรก็ตาม เพียง Windows 10/11 เท่านั้น ส่วน voice changer และการถอดความ Whisper ของวัฒนาการการทำงานนี้ใช้ได้เฉพาะใน Windows เท่านั้น บันทึก Markdown ที่ได้นั้นจะมีการซิงค์ที่ใดก็ได้ผ่าน Obsidian Sync หรือโฟลเดอร์คลาวด์ใด ๆ
ฉันจะรวมเสียง memo กับ Obsidian Daily Notes ได้อย่างไร Plugin Speech to Text สามารถตั้งค่าให้เพิ่มข้อความที่ถอดความลงในแม่แบบบันทึกประจำวันโดยอัตโนมัติ ตั้งค่าไฟล์เป้าหมายให้ชี้ไปที่พาธ Daily Notes ของคุณและแต่ละเซสชันพูดเข้าคำจะเพิ่มบล็อกที่มีแสตมป์เวลาลงในบันทึกของวันนั้น
ฉันสามารถสร้างแผนภาพ Mermaid จากเสียง memo ใน Obsidian ได้หรือไม่ ไม่ใช่โดยอัตโนมัติ แต่วัฒนาการการทำงานเข้ากับมันได้ดี พูดเข้าคำคำอธิบายด้วยวาจาของกระบวนการ รับ Whisper transcript จากนั้นวางข้อความลงในข้อความ language model ที่ส่งออกแผนภาพ Mermaid คัดลอกผลลัพธ์ลงในบล็อกโค้ด mermaid ที่ล้อมรอบและ Obsidian จะแสดงผลโดยตรง