ମଡେଲ ଟ୍ରେନିଂରେ ଷ୍ଟୋରେଜକୁ ମୁଖ୍ୟ ବୋତଲ ହେବାକୁ ଦିଅ ନାହିଁ |

କୁହାଯାଇଛି ଯେ ଟେକ୍ନୋଲୋଜି କମ୍ପାନୀଗୁଡିକ ଜିପିୟୁ ପାଇଁ ଚେଷ୍ଟା କରୁଛନ୍ତି କିମ୍ବା ସେଗୁଡିକ ହାସଲ କରିବା ରାସ୍ତାରେ ଯାଉଛନ୍ତି।ଏପ୍ରିଲରେ, ଟେସଲା ସିଇଓ ଏଲୋନ୍ ମସ୍କ 10,000 ଜିପିୟୁ କିଣିଥିଲେ ଏବଂ କହିଥିଲେ ଯେ କମ୍ପାନୀ NVIDIA ରୁ ବହୁ ପରିମାଣର ଜିପିୟୁ କ୍ରୟ ଜାରି ରଖିବ |ଏଣ୍ଟରପ୍ରାଇଜ୍ ପାର୍ଶ୍ IT ରେ, ଆଇଟି କର୍ମକର୍ତ୍ତାମାନେ ମଧ୍ୟ ପୁଞ୍ଜି ନିବେଶର ରିଟର୍ଣ୍ଣକୁ ସର୍ବାଧିକ କରିବା ପାଇଁ ଜିପିୟୁଗୁଡିକ କ୍ରମାଗତ ଭାବରେ ବ୍ୟବହାର କରାଯିବା ନିଶ୍ଚିତ କରିବାକୁ କଠିନ ପରିଶ୍ରମ କରୁଛନ୍ତି |ତଥାପି, କେତେକ କମ୍ପାନୀ ଖୋଜି ପାଇପାରନ୍ତି ଯେ ଯେତେବେଳେ ଜିପିୟୁ ସଂଖ୍ୟା ବ increases େ, ଜିପିୟୁ ନିଷ୍କ୍ରିୟତା ଅଧିକ ଘୋର ହୋଇଯାଏ |

ଯଦି ଇତିହାସ ଆମକୁ ଉଚ୍ଚ କ୍ଷମତା ସମ୍ପନ୍ନ ଗଣନା (HPC) ବିଷୟରେ କିଛି ଶିକ୍ଷା ଦେଇଛି, ଏହା ହେଉଛି ଗଣନା ଉପରେ ଅଧିକ ଧ୍ୟାନ ଦେବା ଖର୍ଚ୍ଚରେ ଷ୍ଟୋରେଜ୍ ଏବଂ ନେଟୱାର୍କିଂକୁ ବଳି ଦିଆଯିବା ଉଚିତ୍ ନୁହେଁ |ଯଦି ଷ୍ଟୋରେଜ୍ କମ୍ପ୍ୟୁଟିଂ ୟୁନିଟ୍କୁ ଦକ୍ଷତାର ସହିତ ତଥ୍ୟ ସ୍ଥାନାନ୍ତର କରିପାରିବ ନାହିଁ, ଯଦିଓ ଆପଣଙ୍କର ଦୁନିଆରେ ସର୍ବାଧିକ GPU ଥାଏ, ତେବେ ଆପଣ ସର୍ବୋଚ୍ଚ ଦକ୍ଷତା ହାସଲ କରିବେ ନାହିଁ |

ଛୋଟ ୱାର୍ଲ୍ଡ ବିଗ୍ ଡାଟାର ଆନାଲିଷ୍ଟ ମାଇକ୍ ମ୍ୟାଚେଟ୍ଙ୍କ ଅନୁଯାୟୀ, ଛୋଟ ମଡେଲଗୁଡିକ ମେମୋରୀ (RAM) ରେ ଏକଜେକ୍ୟୁଟ୍ ହୋଇପାରିବ, ଯାହା ଗଣନା ଉପରେ ଅଧିକ ଧ୍ୟାନ ଦେବ |ତଥାପି, କୋଟି କୋଟି ନୋଡ ସହିତ ChatGPT ପରି ବୃହତ ମଡେଲଗୁଡିକ ଅଧିକ ମୂଲ୍ୟ ହେତୁ ସ୍ମୃତିସ୍ଥାନରେ ଗଚ୍ଛିତ ହୋଇପାରିବ ନାହିଁ |

ମ୍ୟାଚେଟ୍ କୁହନ୍ତି, “ଆପଣ ସ୍ମୃତିରେ କୋଟି କୋଟି ନୋଡ୍ ଫିଟ୍ କରିପାରିବେ ନାହିଁ, ତେଣୁ ଷ୍ଟୋରେଜ୍ ଅଧିକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ହୋଇଯାଏ |ଦୁର୍ଭାଗ୍ୟବଶତ।, ଯୋଜନା ପ୍ରକ୍ରିୟା ସମୟରେ ତଥ୍ୟ ସଂରକ୍ଷଣକୁ ପ୍ରାୟତ over ଅଣଦେଖା କରାଯାଏ |

ସାଧାରଣତ ,, ବ୍ୟବହାର ମାମଲାକୁ ଖାତିର ନକରି, ମଡେଲ ତାଲିମ ପ୍ରକ୍ରିୟାରେ ଚାରୋଟି ସାଧାରଣ ପଏଣ୍ଟ ଅଛି:

1. ମଡେଲ୍ ଟ୍ରେନିଂ |
2. ଆବେଦନ ଆବେଦନ
3. ଡାଟା ଷ୍ଟୋରେଜ୍
4. ତ୍ୱରିତ ଗଣନା

ମଡେଲଗୁଡିକ ସୃଷ୍ଟି ଏବଂ ନିୟୋଜନ କରିବାବେଳେ, ଅଧିକାଂଶ ଆବଶ୍ୟକତା ଶୀଘ୍ର ପ୍ରୁଫ୍-ଅଫ୍-କନ୍ସେପ୍ଟ (POC) କିମ୍ବା ମଡେଲ୍ ଟ୍ରେନିଂ ଆରମ୍ଭ କରିବା ପାଇଁ ପରୀକ୍ଷଣ ପରିବେଶକୁ ପ୍ରାଥମିକତା ଦେଇଥାଏ, ଡାଟା ଷ୍ଟୋରେଜ୍ ଉପରେ ଅଧିକ ଧ୍ୟାନ ଦିଆଯାଇନଥାଏ |

ତଥାପି, ଆହ୍ .ାନଟି ହେଉଛି ଯେ ତାଲିମ କିମ୍ବା ଇନଫେରେନ୍ସ ନିୟୋଜନ ମାସ କିମ୍ବା ବର୍ଷ ପର୍ଯ୍ୟନ୍ତ ରହିପାରେ |ଅନେକ କମ୍ପାନୀ ଏହି ସମୟ ମଧ୍ୟରେ ଶୀଘ୍ର ସେମାନଙ୍କର ମଡେଲ୍ ଆକାରକୁ ମାପଚୁପ କରନ୍ତି, ଏବଂ ବ growing ୁଥିବା ମଡେଲ ଏବଂ ଡାଟାସେଟଗୁଡିକୁ ସ୍ଥାନିତ କରିବା ପାଇଁ ଭିତ୍ତିଭୂମି ବିସ୍ତାର ହେବା ଆବଶ୍ୟକ |

ଲକ୍ଷ ଲକ୍ଷ ML ତାଲିମ କାର୍ଯ୍ୟ ଭାର ଉପରେ ଗୁଗୁଲରୁ ହୋଇଥିବା ଅନୁସନ୍ଧାନରୁ ଜଣାପଡିଛି ଯେ ହାରାହାରି 30% ତାଲିମ ସମୟ ଇନପୁଟ୍ ଡାଟା ପାଇପଲାଇନରେ ଖର୍ଚ୍ଚ ହୋଇଥାଏ |ଅତୀତର ଗବେଷଣା ତାଲିମକୁ ତ୍ୱରାନ୍ୱିତ କରିବା ପାଇଁ ଜିପିୟୁକୁ ଅପ୍ଟିମାଇଜ୍ କରିବା ଉପରେ ଧ୍ୟାନ ଦେଇଥିବାବେଳେ ଡାଟା ପାଇପଲାଇନର ବିଭିନ୍ନ ଅଂଶକୁ ଅପ୍ଟିମାଇଜ୍ କରିବାରେ ଅନେକ ଚ୍ୟାଲେଞ୍ଜ ରହିଆସିଛି |ଯେତେବେଳେ ତୁମର ମହତ୍ comp ପୂର୍ଣ୍ଣ ଗଣନା ଶକ୍ତି ଅଛି, ପ୍ରକୃତ ବଟଲିନ୍କ୍ ଫଳାଫଳ ପାଇବା ପାଇଁ ତୁମେ କେତେ ଶୀଘ୍ର ଗଣନାରେ ତଥ୍ୟ ଫିଡ୍ କରିପାରିବ |

ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବରେ, ଡାଟା ଷ୍ଟୋରେଜ୍ ଏବଂ ମ୍ୟାନେଜମେଣ୍ଟରେ ଆହ୍ .ାନଗୁଡିକ ଡାଟା ଅଭିବୃଦ୍ଧି ପାଇଁ ଯୋଜନା ଆବଶ୍ୟକ କରେ, ତୁମେ ଅଗ୍ରଗତି କଲାବେଳେ ତଥ୍ୟର ମୂଲ୍ୟକୁ କ୍ରମାଗତ ଭାବରେ ବାହାର କରିବାକୁ ଅନୁମତି ଦିଏ, ବିଶେଷତ when ଯେତେବେଳେ ତୁମେ ଅଧିକ ଉନ୍ନତ ବ୍ୟବହାର ମାମଲା ଯେପରିକି ଗଭୀର ଶିକ୍ଷା ଏବଂ ସ୍ନାୟୁ ନେଟୱାର୍କରେ ପ୍ରବେଶ କର, ଯାହା ଉପରେ ଅଧିକ ଚାହିଦା ଥାଏ | କ୍ଷମତା, କାର୍ଯ୍ୟଦକ୍ଷତା, ଏବଂ ମାପନୀୟତା ଦୃଷ୍ଟିରୁ ସଂରକ୍ଷଣ |

ବିଶେଷ ଭାବରେ:

ମାପନୀୟତା
ମେସିନ୍ ଲର୍ନିଂ ବିପୁଳ ପରିମାଣର ଡାଟା ପରିଚାଳନା କରିବା ଆବଶ୍ୟକ କରେ ଏବଂ ତଥ୍ୟର ପରିମାଣ ବ increases ଼ିବା ସହିତ ମଡେଲଗୁଡିକର ସଠିକତା ମଧ୍ୟ ଉନ୍ନତ ହୁଏ |ଏହାର ଅର୍ଥ ହେଉଛି ବ୍ୟବସାୟୀମାନେ ପ୍ରତିଦିନ ଅଧିକ ତଥ୍ୟ ସଂଗ୍ରହ ଏବଂ ସଂରକ୍ଷଣ କରିବା ଆବଶ୍ୟକ |ଯେତେବେଳେ ଷ୍ଟୋରେଜ୍ ସ୍କେଲ କରିପାରିବ ନାହିଁ, ଡାଟା-ଇଣ୍ଟେନ୍ସିଭ୍ ୱାର୍କ ଲୋଡ୍ ବୋତଲ ସୃଷ୍ଟି କରେ, କାର୍ଯ୍ୟଦକ୍ଷତାକୁ ସୀମିତ କରେ ଏବଂ ଫଳସ୍ୱରୂପ ବ୍ୟୟବହୁଳ GPU ନିଷ୍କ୍ରିୟ ସମୟ |

ନମନୀୟତା |
ଏକାଧିକ ପ୍ରୋଟୋକଲ ପାଇଁ ନମନୀୟ ସମର୍ଥନ (NFS, SMB, HTTP, FTP, HDFS, ଏବଂ S3 ଅନ୍ତର୍ଭୂକ୍ତ କରି) ଏକ ପ୍ରକାରର ପରିବେଶରେ ସୀମିତ ରହିବା ପରିବର୍ତ୍ତେ ବିଭିନ୍ନ ସିଷ୍ଟମର ଆବଶ୍ୟକତା ପୂରଣ କରିବା ଆବଶ୍ୟକ |

ବିଳମ୍ବ
ଏକାଧିକ ଥର ଡାଟା ପ read ଼ାଯିବା ଏବଂ ପୁନ ere ପ ad ଼ିବା ହେତୁ ମଡେଲ ଗଠନ ଏବଂ ବ୍ୟବହାର ପାଇଁ I / O ବିଳମ୍ବ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ |I / O ବିଳମ୍ବତା ହ୍ରାସ କରିବା ମଡେଲଗୁଡିକର ତାଲିମ ସମୟକୁ ଦିନ କିମ୍ବା ମାସକୁ ଛୋଟ କରିପାରେ |ଦ୍ରୁତ ମଡେଲ ବିକାଶ ସିଧାସଳଖ ଅଧିକ ବ୍ୟବସାୟିକ ସୁବିଧାକୁ ଅନୁବାଦ କରେ |

ଥ୍ରୋପପୁଟ୍
ଦକ୍ଷ ମଡେଲ ତାଲିମ ପାଇଁ ଷ୍ଟୋରେଜ୍ ସିଷ୍ଟମର ଥ୍ରୋପପୁଟ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ |ପ୍ରଶିକ୍ଷଣ ପ୍ରକ୍ରିୟାରେ ବହୁ ପରିମାଣର ତଥ୍ୟ ଅନ୍ତର୍ଭୁକ୍ତ, ସାଧାରଣତ per ଘଣ୍ଟା ପ୍ରତି ଟେରାବାଇଟରେ |

ସମାନ୍ତରାଳ ପ୍ରବେଶ
ଉଚ୍ଚ ଥ୍ରୋପପୁଟ ହାସଲ କରିବାକୁ, ଟ୍ରେନିଂ ମଡେଲଗୁଡିକ କାର୍ଯ୍ୟକଳାପକୁ ଏକାଧିକ ସମାନ୍ତରାଳ କାର୍ଯ୍ୟରେ ବିଭକ୍ତ କରେ |ଏହାର ପ୍ରାୟତ means ଅର୍ଥ ହେଉଛି ଯେ ମେସିନ୍ ଲର୍ନିଂ ଆଲଗୋରିଦମଗୁଡ଼ିକ ଏକାଧିକ ଫାଇଲରୁ (ସମ୍ଭବତ multiple ଏକାଧିକ ଭ physical ତିକ ସର୍ଭରରେ) ସମାନ ଫାଇଲଗୁଡ଼ିକୁ ପ୍ରବେଶ କରନ୍ତି |କାର୍ଯ୍ୟଦକ୍ଷତାକୁ ସାମ୍ନା ନକରି ଷ୍ଟୋରେଜ୍ ସିଷ୍ଟମ୍ ଏକକାଳୀନ ଦାବିଗୁଡିକ ପରିଚାଳନା କରିବା ଜରୁରୀ |

ନିମ୍ନ ବିଳମ୍ବତା, ଉଚ୍ଚ ଥ୍ରୋପପୁଟ ଏବଂ ବୃହତ-ସମାନ୍ତରାଳ I / O ରେ ଏହାର ଉଲ୍ଲେଖନୀୟ ସାମର୍ଥ୍ୟ ସହିତ, ଡେଲ ପାୱାରସ୍କେଲ୍ GPU- ତ୍ୱରିତ ଗଣନା ପାଇଁ ଏକ ଆଦର୍ଶ ସଂରକ୍ଷଣ ଉପାଦାନ |ପାୱାରସ୍କେଲ୍ ବିଶ୍ଳେଷଣ ମଡେଲଗୁଡିକ ପାଇଁ ଆବଶ୍ୟକ ସମୟକୁ ଫଳପ୍ରଦ ଭାବରେ ହ୍ରାସ କରେ ଯାହା ମଲ୍ଟି-ଟେରାବାଇଟ୍ ଡାଟାସେଟ୍ଗୁଡ଼ିକୁ ପ୍ରଶିକ୍ଷଣ ଦେଇଥାଏ |ପାୱାର୍ ସ୍କେଲ୍ ଅଲ-ଫ୍ଲାସ୍ ଷ୍ଟୋରେଜ୍ ରେ, ବ୍ୟାଣ୍ଡୱିଡଥ୍ 18 ଗୁଣ ବ increases ିଥାଏ, I / O ବୋତଲଗୁଡ଼ିକୁ ଦୂର କରି, ଏବଂ ବହୁ ପରିମାଣର ଅଣସଂଗଠିତ ତଥ୍ୟର ମୂଲ୍ୟକୁ ତ୍ୱରାନ୍ୱିତ ଏବଂ ଅନଲକ୍ କରିବାକୁ ବିଦ୍ୟମାନ ଇସିଲନ୍ କ୍ଲଷ୍ଟରରେ ଯୋଗ କରାଯାଇପାରିବ |

ଅଧିକନ୍ତୁ, ପାୱାରସ୍କେଲର ମଲ୍ଟି-ପ୍ରୋଟୋକଲ୍ ଆକସେସ୍ କ୍ଷମତା କାର୍ଯ୍ୟଭାର ଚଲାଇବା ପାଇଁ ଅସୀମିତ ନମନୀୟତା ପ୍ରଦାନ କରିଥାଏ, ଯାହାକି ଗୋଟିଏ ପ୍ରୋଟୋକଲ୍ ବ୍ୟବହାର କରି ତଥ୍ୟ ସଂରକ୍ଷଣ କରିବାକୁ ଏବଂ ଅନ୍ୟଟି ବ୍ୟବହାର କରି ଆକ୍ସେସ୍ କରିବାକୁ ଅନୁମତି ଦେଇଥାଏ |ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବରେ, ପାୱାର୍ ସ୍କେଲ୍ ପ୍ଲାଟଫର୍ମର ଶକ୍ତିଶାଳୀ ବ features ଶିଷ୍ଟ୍ୟ, ନମନୀୟତା, ମାପନୀୟତା, ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ୍-ଗ୍ରେଡ୍ କାର୍ଯ୍ୟକାରିତା ନିମ୍ନଲିଖିତ ଆହ୍ address ାନଗୁଡିକୁ ସମାଧାନ କରିବାରେ ସାହାଯ୍ୟ କରେ:

- ମଡେଲ୍ ଟ୍ରେନିଂ ଚକ୍ରକୁ ହ୍ରାସ କରି 2.7 ଗୁଣ ପର୍ଯ୍ୟନ୍ତ ନୂତନତ୍ୱକୁ ତ୍ୱରାନ୍ୱିତ କରନ୍ତୁ |

- I / O ବୋତଲଗୁଡିକୁ ଦୂର କରନ୍ତୁ ଏବଂ ଦ୍ରୁତ ମଡେଲ ତାଲିମ ଏବଂ ବ valid ଧତା, ଉନ୍ନତ ମଡେଲ ସଠିକତା, ଉନ୍ନତ ଡାଟା ବିଜ୍ science ାନ ଉତ୍ପାଦନକ୍ଷମତା, ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ-ଗ୍ରେଡ୍ ବ features ଶିଷ୍ଟ୍ୟ, ଉଚ୍ଚ କାର୍ଯ୍ୟଦକ୍ଷତା, ସମନ୍ୱୟ ଏବଂ ମାପକାଠି ବ୍ୟବହାର କରି କମ୍ପ୍ୟୁଟିଂ ନିବେଶ ଉପରେ ସର୍ବାଧିକ ଫେରସ୍ତ ଫେରସ୍ତ |ଗୋଟିଏ କ୍ଲଷ୍ଟରରେ 119 PB ପର୍ଯ୍ୟନ୍ତ ପ୍ରଭାବଶାଳୀ ଷ୍ଟୋରେଜ୍ କ୍ଷମତା ବ୍ୟବହାର କରି ଗଭୀର, ଉଚ୍ଚ-ବିଭେଦନ ଡାଟାବେସ ସହିତ ମଡେଲ ସଠିକତା ବୃଦ୍ଧି କର |

- ଛୋଟ ଏବଂ ସ୍ ently ାଧୀନ ଭାବରେ ଗଣନା ଏବଂ ଷ୍ଟୋରେଜ୍ ମାପିବା, ଦୃ ust ଡାଟା ସୁରକ୍ଷା ଏବଂ ସୁରକ୍ଷା ବିକଳ୍ପ ପ୍ରଦାନ କରି ସ୍କେଲରେ ନିୟୋଜନ ହାସଲ କରନ୍ତୁ |

- ଦ୍ରୁତ, ନିମ୍ନ-ବିପଦ ନିୟୋଜନ ପାଇଁ ସ୍ଥାନ-ଆନାଲିଟିକ୍ସ ଏବଂ ପୂର୍ବ-ବ ated ଧ ସମାଧାନ ସହିତ ତଥ୍ୟ ବିଜ୍ଞାନ ଉତ୍ପାଦନରେ ଉନ୍ନତି କର |

- NVIDIA GPU ତ୍ୱରଣ ଏବଂ NVIDIA DGX ସିଷ୍ଟମ୍ ସହିତ ରେଫରେନ୍ସ ସ୍ଥାପତ୍ୟକୁ ଅନ୍ତର୍ଭୁକ୍ତ କରି ସର୍ବୋତ୍ତମ-ପ୍ରଜାତିର ପ୍ରଯୁକ୍ତିବିଦ୍ୟା ଉପରେ ଆଧାରିତ ପ୍ରମାଣିତ ଡିଜାଇନ୍ଗୁଡ଼ିକୁ ପରିଚାଳନା କରିବା |ପାୱାରସ୍କେଲର ଉଚ୍ଚ କାର୍ଯ୍ୟଦକ୍ଷତା ଏବଂ ସମାନତା ମେସିନ୍ ଶିଖିବାର ପ୍ରତ୍ୟେକ ପର୍ଯ୍ୟାୟରେ ଷ୍ଟୋରେଜ୍ କାର୍ଯ୍ୟଦକ୍ଷତା ଆବଶ୍ୟକତା ପୂରଣ କରେ, ତଥ୍ୟ ହାସଲ ଏବଂ ପ୍ରସ୍ତୁତି ଠାରୁ ଆରମ୍ଭ କରି ମଡେଲ୍ ଟ୍ରେନିଂ ଏବଂ ଇନ୍ଫେରେନ୍ସ ପର୍ଯ୍ୟନ୍ତ |OneFS ଅପରେଟିଂ ସିଷ୍ଟମ୍ ସହିତ, ସମସ୍ତ ନୋଡ୍ ସମାନ OneFS- ଚାଳିତ କ୍ଲଷ୍ଟର ମଧ୍ୟରେ ନିରବଚ୍ଛିନ୍ନ ଭାବରେ କାର୍ଯ୍ୟ କରିପାରିବ, ଏଣ୍ଟରପ୍ରାଇଜ୍ ସ୍ତରୀୟ ବ features ଶିଷ୍ଟ୍ୟ ଯେପରିକି କାର୍ଯ୍ୟଦକ୍ଷତା ପରିଚାଳନା, ଡାଟା ପରିଚାଳନା, ସୁରକ୍ଷା ଏବଂ ତଥ୍ୟ ସୁରକ୍ଷା, ମଡେଲ ତାଲିମ ଏବଂ ବ୍ୟବସାୟ ପାଇଁ ବ valid ଧତାକୁ ଶୀଘ୍ର ସମାପ୍ତ କରିବାକୁ ସକ୍ଷମ କରିଥାଏ |


ପୋଷ୍ଟ ସମୟ: ଜୁଲାଇ -03-2023 |