Kis segítséget kérek tőletek.
Van egy .srt file-om, amiből szeretném kiszedni az időzítési adatokat, hogy csak a tulajdonképpeni feliratszöveg maradjon meg.
Az .srt így néz ki:
Code:
1
00:03:10,167 –> 00:03:11,361
Hello.
2
00:03:12,207 –> 00:03:14,767
My name’s Forrest. Forrest Gump.
3
00:03:20,167 –> 00:03:22,123
Do you want a chocolate?
4
00:03:24,607 –> 00:03:27,883
l could eat about
a million and a half of these.
5
00:03:29,007 –> 00:03:34,001
My mama always said
life was like a box of chocolates.
Arra gondoltam, sed-el kiszedem az időzítési infókat, így majd jó lesz nekem.
Viszont elakadok, hogy hogyan adjam meg a sed-nek, mit is kell kiszednie:
Code:
sed ‘s/[?(00:03:10,167 –> 00:03:11,361)]//g’ /home/salaud/Desktop/NewFile.srt >/home/salaud/Desktop/Forest.txt
Hogyan tudnám megadni, hogy pontosan az így kinéző karaktersorozatot szedje ki, ne pedig a pontosan egyezőt, illetve a szövegben megmaradjon minden kötőjel, és szóköz?
Nincs kedvem 1500 sor szövegből kézzel törölgetni…
Módosítás: Mi a sistergős Isten nyiláért rak be üres sorokat a szövegbe? Ha idézetként rakom bele, ha code-ként, ha előformázva, minden esetben beleszúr soronként +1 üres sort! ??? > 🙁
Hmm, témaváltás után most ok…
legutóbbi hsz