On trouve des drivers audio "virtuels" qui permettent d'enregistrer tout les sons joués.
Côté synthèse vocale, tu as
ça qui est pas mal du tout pour le français (d'ailleurs, je crois que c'est eux qui ont fait les voix des annonces du tram lillois

), et ils proposent d'autres langues aussi. Par contre si ton appli va être publique, je doute que la licence permette d'utiliser leur générateur de démo ^^
Il y a une solution open-source (Espeak + MBROLA), mais de qualité nettement moins bonne :
http://doc.ubuntu-fr.org/synthese_vocaleCôté stockage, si tu veux gagner de la place :
- si la qualité n'a pas trop d'importance et que tu cherches la simplicité, tu peux réduire la fréquence d'échantillonnage (32 kHz c'est quasi-transparent, 16 kHz c'est correct, 8 kHz c'est "qualité téléphone"), et également utiliser une compression A-law ou µ-Law. Si tu encapsules ça dans un fichier WAV, Windows pourra le lire directement. Sous Linux je sais pas si c'est possible, mais la décompression est une simple look-up table donc ça se fait très facilement en quelques lignes de code.
- si tu veux de la qualité sans te prendre de la tête, tu peux faire du MP3 encapsulé dans du WAV. Windows le supporte sans rien avoir à faire. Par contre ce n'est pas multiplateforme.
- si tu veux de la qualité et du multiplateforme, une solution est
Opus, mais c'est plus lourd à gérer.
Pour ce qui est des softs, tu peux convertir éditer et convertir tes fichiers sons avec Audacity (avec une GUI), et avec Sox (utilitaire en ligne de commande) si tu veux traiter plein de fichiers d'un coup. Pour la compression MP3, tu as Lame. Tout ça est open-source.
EDIT : ah, et la synthèse vocale de Windows... j'ai pas testé celle de Windows 7, mais celle de XP était médiocre, et moins bonne que celle de MacOS 7 qui est pourtant sorti bien avant.